Text Data Mining Terstruktur

  Umum

Data

  1. Ingatlah bahwa penambangan data adalah proses mengidentifikasi pola yang valid, baru, mungkin berguna, dan pada akhirnya dapat dipahami dalam data yang disimpan dalam database terstruktur, di mana data disusun berdasarkan atribut atau variabel kategoris, ordinal, atau kontinu dikelola
  2. Manfaat dari penambangan teks dapat dirasakan di area yang mengandung banyak data teks, seperti: B. Hukum (keputusan pengadilan), penelitian akademis (artikel ilmiah), keuangan (laporan triwulanan), kedokteran / kedokteran, biologi (interaksi molekuler), teknologi (file paten) dan pemasaran (komentar pelanggan)
  3. Penambangan teks sama dengan penambangan data dalam arti melayani tujuan yang sama dan menggunakan proses yang sama, tetapi dengan penambangan teks, input ke proses adalah file data yang tidak terstruktur (atau kurang terstruktur) seperti dokumen Word, file PDF, dan teks kutipan. , File XML dll.

Mining

  1. Penggunaan umum lainnya dari penambangan teks termasuk menyaring pelamar berdasarkan kata-kata dalam resume mereka, memblokir email spam, mengklasifikasikan konten situs web, menandai klaim asuransi yang berpotensi tidak benar, menganalisis deskripsi gejala medis untuk membantu dalam diagnosis dan meninjau dokumen perusahaan sebagai bagian dari proses penemuan elektronik
  2. Perangkat lunak penambangan teks juga menyediakan fungsi untuk mengambil informasi yang mirip dengan mesin pencari dan platform pencarian perusahaan. Namun, ini biasanya hanya satu elemen dari aplikasi penambangan teks tingkat tinggi dan bukan penggunaannya yang sebenarnya
  3. Karena penambangan teks dan penambangan web meningkat dalam jumlah dan volume lebih dari data dalam database terstruktur, sangat penting untuk memahami beberapa teknik yang digunakan untuk memproses sejumlah besar data tidak terstruktur

Text

  1. Pada dasarnya, penambangan teks dapat dilihat sebagai suatu proses (dengan dua langkah utama), di mana penataan menjadi sumber data berbasis teks yang berbeda dipaksakan terlebih dahulu dan kemudian informasi dan pengetahuan yang relevan diekstraksi dari data berbasis teks, yang telah disusun dengan berbagai alat dan teknik.
  2. Penambangan teks dapat digunakan tidak hanya untuk mengklasifikasikan dan memfilter email sampah, tetapi juga untuk memprioritaskan email secara otomatis berdasarkan kepentingannya dan menghasilkan balasan otomatis (Weng dan Liu, 2004).
  3. Penambangan teks adalah definisi data penambangan dalam bentuk teks, di mana sumber data biasanya berasal dari dokumen. Tujuannya adalah untuk mencari kata-kata yang dapat mewakili konten dokumen sehingga analisis antar dokumen dapat dilakukan

Proses

  1. Penambangan teks dapat dilihat sebagai proses dua langkah yang dimulai dengan penerapan struktur ke sumber data teks dan diikuti oleh ekstraksi informasi dan pengetahuan yang relevan dari data teks terstruktur ini menggunakan teknik dan alat yang mirip dengan penambangan data
  2. Penambangan teks dapat dilihat sebagai proses dua langkah yang dimulai dengan menerapkan struktur ke sumber data teks dan dilanjutkan dengan ekstraksi informasi dan pengetahuan yang relevan dari data teks terstruktur menggunakan teknik dan alat yang sama seperti penambangan data.
  3. Penambangan teks (juga dikenal sebagai penambangan data teks atau penemuan pengetahuan dalam basis data teks) adalah proses semi-otomatis untuk mengekstraksi berbagai pola data (informasi dan basis data yang berguna) dari sumber data yang tidak terstruktur.

Informasi

  1. Karena pengetahuan adalah kekuatan dalam dunia bisnis saat ini dan pengetahuan diperoleh dari data dan informasi, organisasi bisnis yang dapat memasukkan berbagai sumber data teks secara efektif dan efisien memiliki pengetahuan yang diperlukan untuk membuat keputusan yang lebih baik, yang mengarah pada keunggulan kompetitif. untuk perusahaan yang berbeda tertinggal
  2. Mengacu pada berbagai dokumen yang berkaitan dengan identifikasi konsep yang digunakan bersama, sehingga membantu pengguna menemukan informasi yang mungkin tidak ditemukan metode pencarian konvensional
  3. Penambangan teks adalah penerapan konsep dan teknik penambangan data untuk mencari pola dalam teks, yaitu analisis teks untuk mengekstraksi informasi yang berguna untuk tujuan tertentu

LEAVE A COMMENT