Virus Corona China

  Umum

Merebaknya virus corona yang ada di china membuat kita ingin mencari tahu artikel – artikel tentang corona tersebut. Dengan membaca artikel satu – satu maka akan memakan waktu yangs sangat banyak untuk melihat pola dari inti berita tentang virus corona tersebut.  

pada tulisan ini saya akan menyajikan kepada anda analisa text mining berita – berita tentang virtus corona. sumber berita merupakan dari hasil pencarian dengan mesin pencari google kemudian dibuatkanlah satu kata kunci yang mewakili dari berita – berita tersebut. Dalam membuat pola ini saya mengguanakan bahasa pemrograman python.

Dari hasil analisa text berita tersebut didaptkanlah visualisai kata – kata yang sering digunakan oleh berita dalam membuat artikel tentang virus corona. 

Pada Visualisai di atas dapat dilihat berita paling tinggi memberitakan tentang virus. Virus menjadi kata kunci dalam artikel – artikel berita yang diterbitkan . berikut adalah ranking┬ákata – kata berita tentang virus corona

====================== Ranking Kata ============
              0    1
0         virus  165
1        corona  115
2         china   39
3         orang   37
4          sars   28
5        gejala   28
6        negara   24
7         wuhan   23
8   coronavirus   21
9         hewan   21
10   terinfeksi   20
11      manusia   19
12      infeksi   19
13    kesehatan   19
14        dunia   19
15     kematian   17
16        sakit   17
17   pernapasan   16
18  menyebabkan   15
19        batuk   15
20          air   15
21     penyakit   14
22   penyebaran   14
23       vaksin   14
24          who   14
25    pneumonia   13
26            ?   13
27       tangan   12
28        wabah   12
29         baca   12

Selain membuat ranking kata , saya juga telah membuatkan wordcloud kata – kata dominan yang digunakan. berikut adalah wordcloud tentang virus corona.

Anda dapat melihat pada wordloud di atas merupakan kata – kata yang saling hubung tentang virus corona.

berikut adalah contoh kalimat berita tentang virus corona :

Virus

  1. berdasarkan informasi yang dihimpun, beberapa negara yang mengonfirmasi kasus virus corona di wilayahnya, yaitu: jepang (14 kasus) thailand (14 kasus) singapura (13 kasus) australia (9 kasus) taiwan (9 kasus) malaysia (8 kasus) korea selatan (7 kasus) perancis (6 kasus) amerika serikat (6 kasus) jerman (5 kasus) vietnam (5 kasus) uni emirat arab (4 kasus) kanada (3 kasus) italia (2 kasus) rusia (2 kasus) inggris (2 kasus) kamboja (1 kasus) finlandia (1 kasus) india (1 kasus) nepal (1 kasus) filipina (1 kasus) sri lanka (1 kasus)
  2. secara umum merekomendasikan hal-hal berikut untuk mencegah penyebaran virus corona, yakni: cuci tangan anda sering dengan sabun dan air selama setidaknya 20 detik hindari menyentuh mata, hidung, dan mulut anda dengan tangan yang tidak dicuci hindari kontak langsung dengan orang yang sakit tinggal di rumah saja, saat anda sakit dan lakukan pembersihan pada benda yang sering disentuh apabila anda berpergian ke china, anda harus menghindari kontak dengan orang sakit, menghindari hewan mati atau hidup, pasar hewan atau produk yang berasal dari hewan, seperti daging mentah
  3. menjelaskan ada sejumlah tindakan atau hal yang paling umum yang dapat menyebarkan virus corona antar-manusia, yakni: udara (dari partikel virus dari batuk atau bersin); kontak secara langsung (menyentuh atau berjabat tangan); menyentuh benda atau partikel virus yang berada pada permukaan suatu benda (menyentuh mulut, hidung, atau mata sebelum mencuci tangan);

Corona

  1. komplikasi virus corona pada kasus yang parah, infeksi virus corona bisa menyebabkan beberapa komplikasi serius berikut ini: pneumonia infeksi sekunder pada organ lain gagal ginjal acute cardiac injury acute respiratory distress syndrome kematian pencegahan virus corona sampai saat ini, belum ada vaksin untuk mencegah virus corona
  2. gejala virus corona infeksi virus corona bisa menyebabkan penderitanya mengalami gejala flu, seperti hidung berair dan meler, sakit kepala, batuk, nyeri tenggorokan, dan demam, atau gejala penyakit infeksi pernapasan berat, seperti demam tinggi, batuk berdahak bahkan berdarah, sesak napas, dan nyeri dada
  3. asal virus corona jenis baru sejak adanya kasus pertama kali seseorang terinfeksi virus setelah mengunjungi pasar makanan laut huanan pada 7 januari 2020, bahwa virus itu kemungkinan berasal dari hewan ke manusia

China

  1. Pemerintah china melaporkan naiknya jumlah korban tewas akibat corona setelah sebelumnya organisasi kesehatan dunia (who) menyatakan coronavirus sebagai darurat kesehatan global
  2. selain china, sebelumnya sejumlah negara sudah melaporkan kasus corona yakni: jepang, korsel, taiwan, thailand, vietnam, malaysia, singapura, sri langka, nepal, uni emirat arab, australia, kanada, as, jerman, finlandia dan prancis
  3. apa yang tengah dilakukan untuk menghentikan penyebaran coronavirus? diwartakan new york times, pemerintah china menempatkan kota wuhan dan kota terdekat lainnnya berada pada status diisolasi atau dikarantina

Source Code

Jika anda tertaring ingin mengembangkan text mining ini , berikut source code python yang saya gunakan untuk melakukan text mining. Dengan text mining data text yang selalu bertambah akan dapat di analisa.

import nltk
import matplotlib.pyplot as plt
import  numpy
import pandas
from  wordcloud import WordCloud

#membuka dataset
file = open("textmining.txt")
#transform jadi huruf kecil semua
baca = file.read().lower()
#print(baca)

#summarize
kata = nltk.word_tokenize(baca)
print("====================================")
#print(kata)

#buangkata
buangkata = open("/home/mfahri/github/OpenData/buangkata.txt")
bacabuangkata = buangkata.read()
splitbuang = set(nltk.word_tokenize(bacabuangkata))
#print(set(splitbuang))

#hapusberdasarkanbuangkata
removed = []
for t in kata:
    if t not in splitbuang:
        removed.append(t)





#menghitungranking kata
rankingkata = nltk.FreqDist(removed)
rankingkatax = rankingkata.most_common()
print("--------------------------------------")
print(rankingkatax)
dfr = pandas.DataFrame(rankingkatax)
print("====================== Ranking Kata ============")
print(dfr.head(30))




#membuat grafikkata
rankingkata.plot(30)
plt.savefig("xxx.png")
plt.show()





#membuat wordcloud

wc = WordCloud(stopwords=splitbuang, background_color="White" ,max_words=30).generate(baca)
plt.imshow(wc , interpolation='bilinear')
plt.axis("off")
plt.savefig("2.png")
plt.show()

#pecahkata
pecah  = baca.split(".")
print(pecah)

framepecah = pandas.DataFrame(pecah)
framepecah.to_excel("output.xlsx")

LEAVE A COMMENT