Film Situs Indonesia

  Umum

Semenjak Situs Indoxxi ditutup pada tahun 2020 banyak netizen yang mencari alternatif untuk situs indoxxi. Dengan indoxxi netizen dapat dengan mudah streaming film secara gratis.

pada artikel ini akan membuat text mining tentang streaming film indonesia. menggunakan 3 website teratas berdasarakan hasil pencarian google. text – text dari situs tersebut dijadikan menjadi satu sehingga dapat di analisa lebih mendalam. bahasa pemrograman untuk melakukan text mining streaming film indonesia adalah menggunakan python.

dari hasil running script yang telah saya buat didapatkanlah grafik ranking kata – kata yang sering di tulis oleh artikel sehingga menjadi nomor satu di google

Dari visualisasi di atas dapat di rankingkan 30 kata – kata yang ada di dalam 3 artikel website tersebut yang menjadi kata kunci :

====================== Ranking Kata ============
              0   1
0          film  46
1         situs  40
2     indonesia  22
3     streaming  20
4        ilegal  15
5        nonton  14
6       indoxxi   9
7        gratis   7
8         salah   7
9       netflix   6
10      kominfo   6
11  kementerian   6
12       online   5
13        iflix   5
14          web   5
15    pengelola   5
16         suka   4
17         baca   4
18     aplikasi   4
19         hooq   4
20      pembuat   4
21     menonton   4
22      bioskop   4
23      layanan   4
24   komunikasi   4
25  informatika   4
26         cnbc   4
27   lk21tv.com   4
28        iklan   4
29  ferdinandus   4

Dari kata kunci di atas dapat anda kembangkan untuk membuat tulisan pada artikel website anda sebagai bahan refrensi kata kunci yang sangat di senangi oleh google.

Berikut adalah wordcloud kata – kata yang dominan dalam artikel website 3 teratas di pencarian google tentang streaming film indonesia

Berikut adalah contoh – contoh kata yang digunakan oleh artikel untuk menjadi nomor satu di google .

Film

  1. Kementerian komunikasi dan informatika mengaku pihaknya tidak memblokir situs film streaming ilegal itu
  2. pengelola situs membuat rugi pembuat film dan pemerintah karena tidak membayar royalti dan menyetor pajak sementara mereka mengeruk keuntungan dari ramai kunjungan netizen ke situs
  3. situs streaming digemari bagi pengguna yang enggan mengeluarkan uang untuk menonton film lewat bioskop maupun berlangganan melalui layanan film bioskop dan video-on-demand berbayar

Situs

  1. plt kepala biro humas kementerian komunikasi dan informatika, ferdinandus setu menjelaskan kominfo siap siaga memantau situs ilegal tersebut dan bila ditemukan akan langsung dilakukan pemblokiran serta dengan cara-cara pendukung lainnya
  2. sosialisasi dan edukasi mengenai etika dan tata perilaku di dunia maya termasuk tidak mengakses situs streaming ilegal karena sangat merugikan para konten kreatif dan pekerja seni
  3. hasil survey menunjukkan 63 persen konsumen daring di indonesia menonton film lewat web streaming atau situs torrent, dengan nama indoxxi sebagai situs favorit

Indonesia

  1. indoxxi menyadari bahwa mengedarkan film-film legal itu tidak boleh dan mereka melalui inisiatif sendiri untuk menutup streaming.
  2. jika ada lagi situs streaming ilegal lagi, kementerian kominfo akan kembali lakukan pemblokiran.
  3. nama indoxxi mencuat setelah survei yougov menyebutnya sebagai situs yang paling banyak jadi rujukan para pengunduh film ilegal di indonesia

Source Code

Jika Anda ingin mengembangkan text mining, silahkan gunakan source code saya berikut :

import nltk
import matplotlib.pyplot as plt
import  numpy
import pandas
from  wordcloud import WordCloud

#membuka dataset
file = open("textmining.txt")
#transform jadi huruf kecil semua
baca = file.read().lower()
#print(baca)

#summarize
kata = nltk.word_tokenize(baca)
print("====================================")
#print(kata)

#buangkata
buangkata = open("/home/mfahri/github/OpenData/buangkata.txt")
bacabuangkata = buangkata.read()
splitbuang = set(nltk.word_tokenize(bacabuangkata))
#print(set(splitbuang))

#hapusberdasarkanbuangkata
removed = []
for t in kata:
    if t not in splitbuang:
        removed.append(t)





#menghitungranking kata
rankingkata = nltk.FreqDist(removed)
rankingkatax = rankingkata.most_common()
print("--------------------------------------")
print(rankingkatax)
dfr = pandas.DataFrame(rankingkatax)
print("====================== Ranking Kata ============")
print(dfr.head(30))




#membuat grafikkata
rankingkata.plot(30)
plt.savefig("xxx.png")
plt.show()





#membuat wordcloud

wc = WordCloud(stopwords=splitbuang, background_color="White" ,max_words=30).generate(baca)
plt.imshow(wc , interpolation='bilinear')
plt.axis("off")
plt.savefig("2.png")
plt.show()

#pecahkata
pecah  = baca.split(".")
print(pecah)

framepecah = pandas.DataFrame(pecah)
framepecah.to_excel("output.xlsx")

LEAVE A COMMENT