Preview

Труды Института системного программирования РАН

Расширенный поиск

Автоматическое извлечение новых концептов предметно-специфичных терминов

Аннотация

В статье описывается способ распознавания предметно-специфичных терминов, которые присутствуют в текущей базе знаний, но выражают отсутствующие в ней концепты. Разработанный метод может быть применен к неформальным базам знаний, поскольку требует только вычисления семантической близости между концептами и статистики встречаемости терминов в корпусе документов. Экспериментальная проверка показывает, что разработанный алгоритм превосходит существующие подходы, а также позволяет повысить точность разрешения лексической многозначности.

Об авторе

Н. А. Астраханцев
ИСП РАН
Россия


Список литературы

1. Mallery J. C. Thinking about foreign policy: Finding an appropriate role for artificially intelligent computers // Master’s thesis, MIT Political Science Department. 1988.

2. Turdakov D. Y. Word sense disambiguation methods // Programming and Computer Software. 2010. 36. No 6. P. 309–326.

3. Erk K. Unknown word sense detection as outlier detection // Proceedings of the main conference on Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics. 2006. P. 128–135.

4. Астраханцев Н., Турдаков Д. Методы автоматического построения и обогащения неформальных онтологий // Программирование. 2013. 39. No 1. С. 23–34.

5. Biemann C. Ontology learning from text: A survey of methods // LDV forum. 20. 2005. P. 75–93.

6. Agirre E., Edmonds P. G. Word sense disambiguation: Algorithms and applications. Springer Science+ Business Media. 2006. 33.

7. Erk K., Pado S. Shalmaneser–a toolchain for shallow semantic parsing // Proceedings of LREC. 6. 2006.

8. Faatz A., Steinmetz R. Ontology enrichment with texts from the www // Semantic Web Mining. 2002. P. 20.

9. Chifu E. T., Le Ia I. A. Text-based ontology enrichment using hierarchical self-organizing maps. 2008.

10. Georgiu M., Groza A. Ontology enrichment using semantic wikis and design patterns.

11. Grineva M., Grinev M., Lizorkin D. Effective extraction of thematically grouped key terms from text // Proc. of the AAAI 2009 Spring Symposium on Social Semantic Web. 2009. P. 39–44.

12. El-Beltagy S. R., Rafea A. KP-Miner: A keyphrase extraction system for English and Arabic documents //Information Systems. 2009. 34. No 1. P. 132-144.

13. Pazienza M. T., Pennacchiotti M., Zanzotto F. M. Terminology extraction: an analysis of linguistic and statistical approaches // Knowledge Mining. Springer. 2005. P. 255–279.

14. Ivannikov V., Turdakov D., Nedumov Y. Fast Text Annotation with Linked Data. Eighth International Conference on Computer Science and Information Technologies 26–30 September. 2011. Yerevan, Armenia.

15. Manning C. D., Schutze H. Foundations of statistical natural language processing. MIT press. 1999. P. 237.

16. Breiman L. Random forests // Machine learning. 2001. 45. No 1. P. 5–32.

17. Manning C. D., Schutze H. Foundations of statistical natural language processing. MIT press. 1999. P. 589–594.


Рецензия

Для цитирования:


Астраханцев Н.А. Автоматическое извлечение новых концептов предметно-специфичных терминов. Труды Института системного программирования РАН. 2013;25:167-178.

For citation:


Astrakhantsev N.A. Automatic Extraction of New Concepts from Domain-Specific Terms. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2013;25:167-178. (In Russ.)



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)