한국어 BERT 언어모델

1세부

한국어의 특성을 반영하여 개발한 BERT (Bidirectional Encoder Representations from Transformers) 언어모델 공개, 아래에서 다운 받으실 수 있습니다.

이동
한국어 분석 말뭉치 구축 표준안

1세부

ETRI 언어지능연구실이 주도로 여러 전문가들의 검증을 거쳐 현재 형태소 분석, 개체명 인식, 구문분석, 질문분석이 TTA 표준안으로 채택되었으며, 의미역 인식에 대한 표준안이 제출되어 검증 중에 있습니다. 표준안은 아래에서 다운받으실 수 있습니다.

이동
ETRI 말뭉치

1세부

엑소브레인 QA Datasets(ETRI), 언어분석 말뭉치(ETRI), Koran TimeBank 및 SpaceBank, 울산대 형태/의미 말뭉치 ETRI 인공지능 KAIST 패러프레이즈 말뭉치, Open API 서비스(http://aiopen.etri.re.kr)의 말뭉치 공개 서비스

이동
엑소브레인 한국어 분석 및 질의응답 기술의 개발 현황 및 고도화 계획

1세부

정보과학회지 제35권 제8호, 2017년 8월

다운로드
울산대 말뭉치

3세부(2017~2019)

울산대 말뭉치: 형태소 분석 및 동형이의어 주석 말뭉치 (UTagger-HG), 의존관계 및 의미역 주석 말뭉치 (UTagger-DP/SR), 다의어 수준 의미역 사전 (UPropBank) 제공

이동
한국어 어휘지도 말뭉치 데이터

3세부(2017~2019)

명사 워드넷 1.0 데이터베이스는 무료 배포, 한국어 워드넷 1.5는 검색 서비스 제공

이동
TriviaQA 증거 문서 및 질의에서 추출된 CG 데이터

3세부(2017~2019)

  • TriviaQA 텍스트 데이터에 CG Extractor를 적용하여 추출
  • json 형태의 약 48,000개 문서/16,800천개 트리플 포함
질의 다운로드 증거 문서 다운로드
엑소브레인 3세부 데이터 목록

3세부(2017~2019)

  • 영문 개념 임베딩
  • 영문 컨텍스트 임베딩
  • 형태-의미 주석 말뭉치
  • 의존관계-의미역 주석 말뭉치
  • 개체명 주석 말뭉치
이동