본문으로 이동

바벨넷

위키백과, 우리 모두의 백과사전.
바벨넷
안정화 버전
바벨넷 5.3 / 2023년 12월
운영 체제
종류
라이선스Attribution-NonCommercial-ShareAlike 3.0 Unported
웹사이트babelnet.org

바벨넷(BabelNet)은 로베르토 나비글리의 감독 하에 사피엔차 로마 대학교NLP 그룹에서 개발된 다국어 어휘-의미 지식 그래프, 온톨로지 및 백과사전 사전이다.[1][2] 바벨넷은 위키백과영어의 가장 인기 있는 전산 어휘집워드넷과 연결하여 자동으로 생성되었다. 통합은 자동 매핑을 사용하여 이루어지며, 통계적 기계 번역을 사용하여 자원이 부족한 언어의 어휘적 간극을 채운다. 그 결과는 많은 언어로 어휘화개념개체명을 제공하고 방대한 의미론적 관계로 연결된 백과사전 사전이다. 추가적인 어휘화와 정의는 자유 라이선스 워드넷, 오메가위키, 영어 위키낱말사전, 위키데이터, 프레임넷, 버브넷 등과의 연결을 통해 추가된다. 워드넷과 유사하게, 바벨넷은 다른 언어의 낱말들을 바벨 동의어 묶음이라고 불리는 동의어 집합으로 묶는다. 각 바벨 동의어 묶음에 대해 바벨넷은 워드넷과 위키백과에서 수집한 많은 언어로 된 짧은 정의(풀이)를 제공한다.

Image
바벨넷은 워드넷과 위키백과의 통합으로 얻어진 다국어 의미망이다.

바벨넷 통계

[편집]

2023년 12월 기준 기준으로, 바벨넷(버전 5.3)은 600개 언어를 포괄한다. 거의 2,300만 개의 동의어 묶음과 약 17억 개의 단어 의미를 포함한다(언어와 무관하게). 각 바벨 동의어 묶음은 평균적으로 언어당 2개의 동의어, 즉 단어 의미를 포함한다. 의미망은 워드넷의 모든 어휘-의미 관계(하위어와 상위어, 부분과 전체의 관계, 반의어와 동의어 등, 총 약 364,000개의 관계 에지)뿐만 아니라 위키백과의 미정의된 관련성 관계(총 약 19억 개의 에지)를 포함한다.[1] 버전 5.3은 또한 약 6,100만 개의 이미지를 바벨 동의어 묶음과 연관시키고, SPARQL 엔드포인트를 통해 접근 가능한 자원에 대한 Lemon RDF 인코딩을 제공한다.[3] 267만 개의 동의어 묶음에 도메인 레이블이 할당되었다.

응용

[편집]

바벨넷은 다국어 자연어 처리 응용을 가능하게 하는 것으로 입증되었다. 바벨넷에서 사용할 수 있는 어휘화된 지식은 다음 분야에서 최첨단 결과를 얻는 것으로 나타났다.

수상 및 표창

[편집]

바벨넷은 "이질적인 데이터 소스를 활용하는 다국어 어휘 의미망 및 온톨로지를 통해 언어 장벽을 극복하는 획기적인 작업"으로 2015년 META 상을 수상했다.

바벨넷을 설명하는 인공지능 저널 논문[1]은 2017년 Prominent Paper Award를 수상했다.[9]

바벨넷은 웹에서 이용할 수 있는 혁신적이고 최신 어휘 지식 자원에 대한 타임지 기사에 크게 다루어졌다.[10]

같이 보기

[편집]

각주

[편집]
  1. 1 2 3 R. Navigli and S. P Ponzetto. 2012. BabelNet: The Automatic Construction, Evaluation and Application of a Wide-Coverage Multilingual Semantic Network. Artificial Intelligence, 193, Elsevier, pp. 217-250.
  2. R. Navigli, S. P. Ponzetto. BabelNet: Building a Very Large Multilingual Semantic Network. Proc. of the 48th Annual Meeting of the Association for Computational Linguistics (ACL 2010), Uppsala, Sweden, July 11–16, 2010, pp. 216–225.
  3. M. Ehrmann, F. Cecconi, D. Vannella, J. McCrae, P. Cimiano, R. Navigli. Representing Multilingual Data as Linked Data: the Case of BabelNet 2.0. Proc. of the 9th Language Resources and Evaluation Conference (LREC 2014), Reykjavik, Iceland, 26–31 May 2014.
  4. R. Navigli and S. Ponzetto. 2012. BabelRelate! A Joint Multilingual Approach to Computing Semantic Relatedness 보관됨 2016-03-03 - 웨이백 머신. Proc. of the 26th AAAI Conference on Artificial Intelligence (AAAI 2012), Toronto, Canada, pp. 108-114.
  5. J. Camacho-Collados, M. T. Pilehvar and R. Navigli. NASARI: a Novel Approach to a Semantically-Aware Representation of Items. Proc. of the 2015 Conference of the North American Chapter of the Association for Computational Linguistics (NAACL 2015), Denver, Colorado (US), 31 May-5 June 2015, pp. 567-577.
  6. R. Navigli and S. Ponzetto. Joining Forces Pays Off: Multilingual Joint Word Sense Disambiguation. Proc. of the 2012 Conference on Empirical Methods in Natural Language Processing (EMNLP 2012), Jeju, Korea, July 12–14, 2012, pp. 1399-1410.
  7. A. Moro, A. Raganato, R. Navigli. Entity Linking meets Word Sense Disambiguation: a Unified Approach 보관됨 2014-08-08 - 웨이백 머신 Transactions of the Association for Computational Linguistics (TACL), 2, pp. 231-244, 2014.
  8. D. Jurgens, R. Navigli. It's All Fun and Games until Someone Annotates: Video Games with a Purpose for Linguistic Annotation (PDF). 2015년 1월 3일에 원본 문서 (PDF)에서 보존된 문서. 2015년 1월 3일에 확인함. Transactions of the Association for Computational Linguistics (TACL), 2, pp. 449-464, 2014.
  9. AIJ Awards: List of Current and Previous Winners.
  10. Steinmetz, Katy (May 12, 2016). "Redefining the Modern Dictionary". 타임. 187: 20-21.

외부 링크

[편집]