Preview

Труды Института системного программирования РАН

Расширенный поиск

Совместная вероятностная тематическая модель для идентификации проблемных высказываний, связанных нарушением функциональности продуктов

https://doi.org/10.15514/ISPRAS-2015-27(4)-6

Аннотация

В статье исследуется задача автоматического извлечения информации о существовании различных проблем c продуктами из отзывов пользователей. Для достижения целей исследования предложены две тематические модели на основе латентного размещения Дирихле, позволяющие совместно учитывать несколько типов информации для идентификации проблемных высказываний. Предложенные алгоритмы моделируют распределение слов в документе, учитывая взаимосвязь между скрытыми тематической, тональной и проблемной переменными. Результаты экспериментального исследования анализируются в статье в сравнении с результатами популярных вероятностных моделей для задач анализа мнений, в качестве критериев оценки используются стандартные метрики качества систем анализа текстов и перплексия контрольных данных (perplexity). Эксперименты показали, что наилучшие результаты классификации фраз о проблемах в использовании продуктов показывают предложенные модели, использующие совместную информацию из отзывов пользователей на русском и английском языках.

Об авторе

Е. В. Тутубалина
Казанский (Приволжский) федеральный университет
Россия


Список литературы

1. Сабирова И.M. Качество-ключевой фактор обеспечения конкурентности продуктов и услуг в условиях рыночной экономики. Автоматизация и управление в технических системах, №1, 2015, С. 181-190.

2. Gupta N. K. Extracting descriptions of problems with product and services from twitter data. Proceedings of the 3rd Workshop on Social Web Search and Mining (SWSM2011). Beijing, China, 2011.

3. Solovyev V., Ivanov V. Dictionary-Based Problem Phrase Extraction from User Reviews. Text, Speech and Dialogue, Springer International Publishing, 2014, P. 225-232.

4. Moghaddam S. Beyond Sentiment Analysis: Mining Defects and Improvements from Customer Feedback. Advances in Information Retrieval, Springer International Publishing, 2015, P. 400-410.

5. Tutubalina E. Target-Based Topic Model for Problem Phrase Extraction. Advances in Information Retrieval, 2015, P. 271-277.

6. Blei D. M., Ng A. Y., Jordan M. I. Latent dirichlet allocation. The Journal of machine Learning research., Т. 3, 2003, P. 993-1022.

7. Liu B. Sentiment analysis and opinion mining. Synthesis Lectures on Human Language Technologies, Т. 5. , 2012, P. 1-167.

8. Martínez-Cámara E, Martín-Valdivia M. T., Urena-López L. A., Montejo-Ráe, A. R. Sentiment analysis in twitter. Natural Language Engineering, Т. 20(1), 2014, P. 1-28.

9. Moghaddam S., Ester M. On the design of LDA models for aspect-based opinion mining. Proceedings of the 21st ACM international conference on Information and knowledge management. - ACM, 2012., P. 803-812.

10. Lin C., He Yu., Everson R., Ruger S. Weakly supervised joint sentiment-topic detection from text. Knowledge and Data Engineering, IEEE Transactions on, Т. 24(6), 2012, P. 1134-1145.

11. Jo Y., Oh A. H. Aspect and sentiment unification model for online review analysis. Proceedings of the fourth ACM international conference on Web search and data mining, ACM, 2011, P. 815-824.

12. Z. Yang, A. Kotov, A. Mohan S. Lu. Parametric and Non-parametric User-aware Sentiment Topic Models. Proceedings of the 38th ACM SIGIR, 2015.

13. Heinrich G. Parameter estimation for text analysis. Technical report, 2005.

14. Minka T., Lafferty J. Expectation-propagation for the generative aspect model. Proceedings of the Eighteenth conference on Uncertainty in artificial intelligence. - Morgan Kaufmann Publishers Inc., 2002., P. 352-359.

15. Griffiths T. L., Steyvers M. Finding scientific topics. Proceedings of the National Academy of Sciences, Т. 101 (1), 2004, P. 5228-5235.

16. Loukachevitch N., Blinov P. , Kotelnikov E., Rubtsova Y., Ivanov V., Tutubalina E. SentiRuEval: testing object-oriented sentiment analysis systems in Russian. Proceedings of International Conference Dialog-2015, Moscow, Russia, 2015.

17. Тутубалина Е. В. Извлечение проблемных высказываний, связанных с неисправностями и нарушением функциональности продуктов, на основании отзывов пользователей. «Вестник КГТУ им. А.Н.Туполева», Т. 3, 2015.

18. Ivanov V., Tutubalina E., Mingazov N., Alimova I. Extracting aspects, sentiment and categories of aspects in user reviews about restaurants and cars. Proceedings of International Conference "Dialog-2015", Moscow, Russia, 2015.

19. Воронцов К. В., Потапенко А. А. Регуляризация, робастность и разреженность вероятностных тематических моделей. Компьютерные исследования и моделирование, Т. 4 (4), 2012, С. 693-706.


Рецензия

Для цитирования:


Тутубалина Е.В. Совместная вероятностная тематическая модель для идентификации проблемных высказываний, связанных нарушением функциональности продуктов. Труды Института системного программирования РАН. 2015;27(4):111-128. https://doi.org/10.15514/ISPRAS-2015-27(4)-6

For citation:


Tutubalina E. Sentiment-based Topic Model for Mining Usability Issues and Failures with User Products. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2015;27(4):111-128. (In Russ.) https://doi.org/10.15514/ISPRAS-2015-27(4)-6



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)