Language Lab 에서는 컴퓨터가 인간의 언어를 이해하고 인간과 같은 언어를 말하는 딥러닝 기반의 인공지능 기술을 연구하며 , 자연어 이해 모델을 기반으로 문서 이해 및 대화형 인공지능 솔루션 개발을 목표로 하고 있어요.
자연어 처리 (Natural Language Processing)란 사람의 언어를 컴퓨터가 처리하고 이해할 수 있도록 하는 것으로서, 자연어를 형태분석과 의미 분석 등의 과정을 통해 컴퓨터가 이해할 수 있도록 처리하고, 이 결과물을 사람이 이해할 수 있는 텍스트나 음성, 이미지 등으로 생성하는 작업을 뜻합니다. 자연어 처리 기술은 크게 자연어 이해(Natural Language Understanding)와 자연어 생성 (Natural Language Generation)으로 나눌 수 있습니다. 자연어 이해는 기계 독해, 감정 분석, 의미론적 유사도 측정 등 자연어 형태의 문장을 기계가 이해하는 기술이라면, 자연어 생성은 그와 반대로 기계의 처리 결과를 자연어 형태로 생성하는 기술을 가리키며 대화 생성, 스토리 생성, 요약문 등이 이에 속합니다.
언어 형상을 모델링하여 연속되는 단어의 확률을 계산하는 모델로서 트랜스포머 기반의 BERT, T5, ELECTRA 등의 모델을 구축하여 NLP 어플리케이션에 사용하고 있습니다.
- SP-BERT (Enhanced BERT model)
기계가 사람처럼 문서를 읽고 질문에 대답하는 기술로서 지정된 문서에 대한 질문 뿐만 아니라 임의의 질문에도 대답하는 Open QA 영역으로 연구를 확장하고 있습니다.
- Question Answering System
- Advanced Contents Retrieval
- Table MRC
비정형 텍스트로부터 의미 있는 정보를 찾고 분석하는 기술로서 챗봇을 위한 질의 의도 분석을 중심으로 정보추출, 문서 요약 등의 기술을 확보할 계획입니다.
- Sentiment Analysis
- Document Classification
- Text Summarization
- Information Extraction
AI가 사람 수준으로 대화가 가능한 기술을 연구하고 있습니다. 대화 맥락 이해, 대화 기억 및 추론, 상황에 맞는 실행 계획 등의 기술을 연구합니다.
상황에 맞는 적절한 자연어를 생성하는 기술로서 딥러닝 언어모델 기술을 활용하여, MRC 및 챗봇의 응답발화를 생성하기 위해 사용됩니다.
- Large-scale language generation beyond GPT-3
Meet our leader!
Language Lab 최정규 랩장
“Language Lab은 AI가 스스로 문서를 학습하여 추론하는 Learning-by-reading AI기술 실현을 Vision으로 Machine Reading Comprehension, Text Analytics, Dialog System, Speech-To-Text 그리고 GPT-3를 넘어서는 초거대 언어모델을 연구하고 있습니다.
다양한 연구주제 속에서, 구성원이 최대한 원하는 연구를 스스로 선택하고 마음껏 연구할 수 있는 환경을 제공하고 있습니다. 훌륭한 연구환경에서 저희와 함께 연구하실, 열정 많은 NLP 연구자분들을 기다립니다!