Извличане на знания от неструктурирани данни чрез анализ на мнението на потребители
Автори: Камелия Стефанова, Станимира Йорданова
Резюме
Информацията в бизнес организацията постоянно расте под формата на структурирани и неструктурирани данни. До 2018 г. повече от половината от големите организации в световен мащаб ще се конкурират, използвайки интелигентни аналитични средства за анализ на всякакви видове данни с цел извличане на ново знание. Една от тенденциите, които влияят върху бързото развитие на този пазар, е усъвършенстването на бизнес аналитичността чрез обогатяване с нови методи и алгоритми, способни да извличат и обработват данни от нови източници, предоставящи неструктурираните данни, резултат от взаимодействието с клиентите (Gartner Inc, 2016). Такива източници могат да бъдат социалните онлайн медии и потребителски сайтове, където потребители на стоки и услуги изразяват своето мнение. Използването на методи за анализ на мненията на потребителите позволява на бизнес организациите да се запознаят с мнението на своите клиенти чрез идентифициране на положителни или отрицателни мнения за техните продукти или услуги в интернет. Извличането на знания от коментари на потребители изисква структуриране на данните, след което с помощта на методи и средства на извличане на закономерности от данни и текст, данните се анализират. Получените резултати се визуализират с подходящи средства за бизнес интелигентност, за да допринесат за получаването на нови знания в процеса на подпомагане вземането на управленски решения. Настоящата статия представя основни понятия, методологии и средства, свър- зани с изследването, и предлага методология за извличане на знания от неструктурирани данни чрез анализ на мнението на потребители.
Knowledge Discovery from Unstructured Data using Sentiment Analysis
Information in a business organization is constantly growing today in a form of structured and unstructured data. According to Gartner, Inc., (2016), a world’s leading information technology research and advisory company, “by 2018 more than half of large organizations globally will compete using advanced analytics”. One of the trends that influences the rapid development of this market is business analytics improvement through enrichment with new methods and algorithms to extract and process data from new sources, providing unstructured data especially from interaction with customers. Social media and review sites are possible sources of unstructured data, where users can express their opinion about products and services by posting comments. Business organizations may explore users` opinion using sentiment analysis methods for identifyting positive and negative opinion, expressed about their products and services on the internet. Knowledge discovery from users` comments requires structuring unstructured data and then applying text and data mining methods and tools. Business Intelligent tools are used to present the results from analysis in a proper way to discover new knowledge and to support decision making process in the organisation. The present paper is focused on introducing main definitions, methodologies and tools for mining and analyzing unstructured data from users` comments and a methodology for knowledge discovery from unstructured data using sentiment analysis is suggested.