Ontology Building Using Data Mining Techniques

Open access

Abstract

This paper deals with certain data mining techniques in order to discover their potential for use in automated ontology building. The end goal is the reduction in the time requirement for the construction of any given ontology and necessity for expert consultation. This can be achieved by combining data mining and ontology engineering. The aim of this paper is to take a deeper look at potentially useful data mining techniques for an automated ontology building process, to research related publications in this field and to propose ideas on how to use data mining techniques in ontology building.

Ontoloģija ir modelis, kas izmanto konceptus un saites starp tiem, lai aprakstītu noteiktu nozari. Tas tiek izmantota, lai definētu kopīgu terminoloģiju un nozares zināšanas, kas ir kopīgi pieejamas lietotājam un datorprogrammām. Ontoloģijas uzbūve ir laikietilpīgs un sarežģīts process, kurā parasti piedalās nozares eksperts. Lai atvieglotu un paātrinātu šo procesu, kā arī lai atbrīvotos no nepieciešamības iesaistīt ekspertu, tiek piedāvāts izmantot datu ieguves tehnikas ontoloģiju būvēšanas automatizācijai. Tika apskatīti klasterizācijas, klasifikācijas, asociācijas un prognozēšanas paņēmieni un izvirzīti priekšlikumi to lietošanai automatizētā ontoloģijas būvēšanā. Tika dota ontoloģijas formālā definīcija, kurā tiek nosaukti visi tās elementi. Tika veikts saistīto zinātnisko publikāciju apskats tabulas veidā, kurā ir izklāstīts, kādi paņēmieni tika izmantoti un kādi ir iegūtie rezultāti. Ne visi apskatītie darbi piedāvāja ontoloģijas uzbūves automatizācijas iespējas, daži aprakstīja manuālo pieeju. Veiktajā pārskatā atklājās, ka datu ieguves tehnikas tiešām ir lietojamas ontoloģijas uzbūves automatizācijai un var sniegt iespaidīgus rezultātus. Bieži datu iegūšanas algoritmu rezultāts tiešā veidā tiek pārņemts ontoloģijā. No citu darbiem tika iegūts, ka manuāli būvētas ontoloģijas tomēr mēdz būt dziļāk aprakstītas un satur vairāk informācijas. Automātiski būvētas ontoloģijas dotajā brīdī ir vienkāršākas, tomēr tiek veidotas daudz ātrāk un bez nozares eksperta. Tas ļauj izmantot automātisku ontoloģijas uzbūvi tādās nozarēs, kurās nav ekspertu, kā arī atklāt un iegūt līdz šim nezināmo informāciju. Vispiemērotākais algoritms dotajam uzdevumam ir ar nosaukumu COBWEB, kas izmanto neuzraudzīto klasterizāciju un varbūtības mērus konceptu atklāšanai.

Онтология представляет собой модель, которая использует понятия и связи между ними, чтобы описать определённую отрасль. Она используется, чтобы определить общую терминологию и знания об отрасли, которые общедоступны для пользователя и программного обеспечения. Построение онтологий является длительным и сложным процессом, в котором, как правило, участвует отраслевой эксперт. Для облегчения и ускорения этого процесса, а также чтобы избавиться от необходимости привлечения экспертов, предлагается использовать методы добычи данных для автоматизации построения онтологий. Были рассмотрены методы кластеризации, классификации, ассоциации и прогноза, а также выдвинуты предложения по их использованию в автоматизированном построении онтологии. Дано формальное определение онтологии, которое обозначает все ее элементы. Был сделан обзор научных публикаций в виде таблицы, в которой излагалось, какие методы использовались и какие были получены результаты. Не все рассмотренные статьи давали возможность автоматизированного проектирования онтологии, некоторые предполагали ручной подход. Проведённый обзор показал, что методы интеллектуального анализа данных используются для автоматизации построения онтологии и могут обеспечить впечатляющие результаты. Часто результат алгоритмов добычи данных непосредственно передаётся в онтологию. Из других статей стало известно, что вручную построенные онтологии, как правило, более глубоко описаны и содержат больше информации. Автоматически построенные онтологии в данный момент являются более простыми, однако они создаются намного быстрее и без отраслевого эксперта. Это позволяет автоматическое построение онтологии в отраслях, где нет экспертов, а также выявление и получение ранее неизвестных сведений. Наиболее подходящим алгоритмом для данной задачи является COBWEB, который использует самообучающуюся кластеризацию и вероятностные меры для обнаружения концептов.

References
  • [1] Asunción Gómez-Pérez, Mariano Fernández-López, Oscar Corcho, “Ontological Engineering: With Examples from the Areas of Knowledge Management, E-commerce and the Semantic Web”, 2004, Springer

  • [2] Natalya F. Noy, Deborah L. McGuinness, “Ontology Development 101: A Guide to Creating Your First Ontology”, 2001, Stanford University, Stanford, CA, 94305

  • [3] Encyclopedia Britannica, www.britannica.com/EBchecked/topic/1056150/data-mining

  • [4] Patrick Clerkin, Padraig Cunningham, Conor Hayes, “Ontology Discovery for the Semantic Web Using Hierarchical Clustering”

  • [5] Data mining techniques, www.dataminingtechniques.net/

  • [6] Abd-Elrahman Elsayed, Samhaa R. El-Beltagy, Mahmoud Rafea, Osman Hegazy, “Applying data mining for ontology building ”

  • [7] R Agrawal, T. Imieliński, A. Swami, “Mining association rules between sets of items in large databases”, 1993, Proceedings of the 1993 ACM SIGMOD international conference on Management of data

  • [8] A. Bhagat, S. Sharma, K. R. Pardasani, “Ontological Frequent Patterns Mining by potential use of Neural Network”, 2011, International Journal of Computer Applications

  • [9] N. Chalortham, P. Leesawat, M. Buranarch, T. Supnithi, “Ontology Development for Pharmaceutical Tablet Production Expert System”, 2008, Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology, 2008. ECTI-CON 2008. 5th International Conference

  • [10] Darya Plinere, Arkady Borisov, “SWRL: Rule Acquisition Using Ontology”, 2009, Scientific Journal of Riga Technical University.

  • [11] J. Graca, M. Mourao, O. Anunciacao, P. Monteiro, H. S. Pinto, V. Loureiro, “Ontology building process: The wine domain”

  • [12] Jackson, Peter (1998), Introduction To Expert Systems (3 ed.)

  • [13] Yildiz Burcu, “Ontology Evolution and Versioning: The state of the art”, 2006, Vienna University of Technology

  • [14] M. d’Aquin, G. Kronberger, M. C. Suárez-Figueroa, „Combining Data Mining and Ontology Engineering to enrich Ontologies and Linked Data“

  • [15] K. Ottens, M.-P. Gleizes, P. Glize, „A Multi-Agent System for Building Dynamic Ontologies“, 2007, IFAAMAS

  • [16] N. Chalortham, P. Leesawat, M. Buranarach, T. Supnithi, “Ontology Development for Pharmaceutical Tablet Production Expert System”, 2008, Proceedings of ECTI-CON

  • [17] A. Jovic, D. Gamberger, G. Krstacic, “Heart failure ontology”

Information Technology and Management Science

The Journal of Riga Technical University

Journal Information

Metrics

All Time Past Year Past 30 Days
Abstract Views 0 0 0
Full Text Views 31 31 20
PDF Downloads 8 8 7