fbpx

Pengertian NLP dan Text Mining

By: Tommy Wijaya   |   February 7th, 2018

nlp-and-textmining

Dalam data science, kita sering mendengar istilah machine learning dan data visualization. Tapi sebenarnya, data science mencakup bidang yang jauh lebih luas – banyak istilah-istilah teknologi yang termasuk dalam kategori “data science”. Salah satunya yang cenderung lebih jarang kita dengar adalah NLP, yaitu Natural Language Processing dan juga Text Mining, atau dikenal juga dengan istilah text analytics.

Pada dasarnya, NLP dan text mining merupakan teknologi artificial intelligence (AI) yang memungkinkan penggunanya untuk mengubah konten inti dari sebuah dokumen teks menjadi sebuah data kuantitatif secara cepat. Data kuantitatif tersebut nantinya akan dapat digunakan atau ditindaklanjutkan sesuai keinginan penggunanya.

Bayangkan dalam sebuah perusahaan yang bergerak dalam bidang ilmu kesehatan, para pekerja (tenaga manusia) harus menemukan informasi yang tepat dari sejumlah teks yang sangat besar. Proses manual ini akan menghabiskan waktu yang sangat lama. Menemukan informasi tersebut sangat penting dalam membuat keputusan bisnis yang tepat, tapi sekitar 80% informasi tersebut tersembunyi dalam kumpulan teks yang tidak beraturan. Dengan menggunakan metode keyword search konvensional, tenaga manusia hanya dapat menarik sejumlah dokumen yang mengandung keyword tersebut, dan masih harus membacanya dengan teliti. Sangat melelahkan bukan?

Dengan bantuan teknologi NLP dan text mining, proses tersebut dapat menjadi jauh lebih efisien dibandingkan proses manual, dan juga menarik informasi atau wawasan yang mungkin tidak bisa didapatkan secara manual. Informasi tersebut kemudian dapat diolah menjadi data terstruktur untuk dianalisa dan divisualisasikan. Intinya, penggunaan keduanya dapat membantu kita untuk meningkatkan efisiensi analisis dokumen teks dengan memberikan kemampuan otomasi pada proses tersebut

NLP dan text mining biasanya digunakan dalam:

  • Menganalisa sebuah survey dimana para peserta menuliskan komentarnya secara bebas
  • Mengklasifikasi email sebagai spam, marketing, atau personal (contoh: Gmail)
  • Menganalisa klaim asuransi atau garansi, wawancara diagnostik, dll
  • Meneliti kompetitor dengan melakukan crawling dalam website mereka.

Tertarik untuk belajar text mining? Yuk daftar workshop data science series Algoritma!

text-mining-workshop

Sources:
http://www.statsoft.com/Textbook/Text-Mining
https://www.linguamatics.com/what-is-text-mining-nlp-machine-learning