7월 19일, LG AI Talk Concert 2023에서 LG의 초거대 AI 모델인 ‘EXAONE 2.0’이 드디어 베일을 벗었습니다!
2020년 12월에 설립된 LG AI연구원은 다양한 산업 현장에 존재하는 난제를 해결하기 위해 열심히 달려왔어요! EXAONE은 개발 초기부터 멀티모달(언어와 시각) 정보의 이해를 통한 혁신을 추구해왔고, 더 나아가 인류가 쌓아온 지식에 기반한 새로운 과학적 발견에도 도전하고 있어요. 언어와 이미지를 이해하고 생성하며, 전문 문헌까지 이해할 수 있는 생성형 AI를 만들어가는 기업은 한국에서 LG AI연구원이 유일하며, 전 세계적으로도 손에 꼽힐 정도입니다
하지만 실제 산업 현장에서는 현재의 생성형 AI를 적용하기 어려운 몇 가지 문재점이 존재하죠. 생성되는 결과에 대한 신뢰도가 높지 않고, 대규모 모델을 학습하고 운영하는 과정에서 많은 비용이 발생하기도 하고, 산업 현장에 적용하는 과정에서 기업 내부 데이터 유출에 대한 우려도 있어요
그래서! 이러한 문제를 해결하기 위해 LG AI연구원은 학습데이터 품질 강화, 비용 효율성 강화, 맞춤형 모델 제공에 집중했고, 그 결과 기존의 생성형 AI와의 확연하게 차별화된 새로운 전문가 AI ‘EXAONE 2.0’이 탄생했습니다! EXAONE 2.0의 공개는 200명이 넘는 기자들이 모일 정도로 뜨거운 관심을 받았는데요, EXAONE 2.0에 대해서 조금 더 자세히 설명해드릴게요!
(EXAONE 개발 배경을 설명해주시는 배경훈 원장님!)
(많은 기자분들께서 열렬히 취재 중인 현장-)
EXAONE 2.0의 차별점
데이터 측면
EXAONE 2.0은 전문 데이터 중심으로 고품질의 데이터를 확보했어요. 논문, 특허 데이터는 4천5백만건 이상, 이미지-텍스트 데이터는 3억5천만장 이상을 보유하고 있고 모든 저작권과 개인정보 이슈를 해결하고 학습을 진행했습니다. 한국어 데이터의 한계를 극복하기 위해 한국어와 영어를 동시에 이해하고 생성할 수 있는 Bilingual 모델을 개발했는데요, 한국어-영어 학습 데이터의 양을 이전 대비 4배 이상 증가시켜, 한국어와 영어 데이터 간의 시너지를 통해 성능을 획기적으로 향상시키고 Bilingual Multi-task Tunning을 통해 성능을 극대화했습니다!
비용 효율성 강화
EXAONE 2.0의 초거대 언어모델은 이전 모델에 비해 추론 처리 시간을 25% 단축하고, 메모리 사용량을 70% 감소시켜 동일 성능의 이전 모델 대비 약 78%의 비용을 절감할 수 있다고 해요. 멀티모달 모델은 더 나은 품질을 위해 메모리 사용량은 2배로 늘리면서 추론 시간을 83% 단축해, 비용을 약 66% 줄여 초거대 AI 의 한계로 지적되어 온 ‘경제성’ 측면을 개선했죠
고객 니즈에 맞춘 Custom Model 제공 가능
EXAONE 2.0은 고객의 니즈와 활용 목적에 따라 맞춤형 모델로 제공될 수 있어요! 입출력 데이터를 텍스트와 이미지 중에서 선택하거나 언어도 고를 수 있죠. 전문 도메인 별로 고객 내부 데이터를 추가로 파인튜닝하거나 구축 방식도 선택할 수 있어요. 이런 커스텀 방식은 도메인별 전문성을 유지하고 내부 데이터 보안 우려를 해소할 수 있어서 전문 산업분야에서 EXAONE 활용도가 크게 높아질 것으로 기대하고 있습니다
EXAONE 2.0의 차별점 3가지를 알아보았는데요, 이제 본격적으로 EXAONE 2.0을 적용한 3대 플랫폼, EXAONE Universe, EXAONE Discovery, EXAONE Atelier를 소개해드릴게요!
전문적인 답변과 인사이트를 제공하는 EXAONE Universe
먼저 EXAONE Universe를 소개해드릴게요. EXAONE Universe는 생성형 AI 기술의 핵심인 초거대 언어모델을 통해 전문적 답변을 생성하고, 나아가 최신 기술을 연구하거나 기업의 전문 업무를 도와주는 플랫폼입니다. 전문 문헌들과 최신 지식을 기반으로 종합적 추론과 논리적 사고가 가능한 모델을 개발하고, 사실적 근거를 수집해 유창한 답변을 생성하는 데 집중했어요.
(누구나 쉽게 알아들을 수 있도록 설명해주시는 문태님!)
Advanced ML Lab의 이문태 랩장님께서 직접 데모를 통해 Universe에 대해 설명해주셨어요! 2023년 현재에도 전문가들은 검색을 통해 정보를 찾는데요, 검색 결과에서 가장 적합한 문서를 선택하고, 다시 필요한 부분을 발췌해, 이들을 종합하여 하나의 유용한 정보를 만들어내는 워크플로우에 상당한 시간을 차지하는 걸로 조사됐다고 해요. 현재 타사들에서 공개되어 있는 초거대 언어모델은 컨텍스트에 맞는 다음 단어를 하나씩 유창하게 생성하나, 답변 근거들의 전체적인 밑그림을 그리기 어렵고 사실이 아닌 말을 만드는 Hallucination 문제가 자주 발생해요.
이러한 문제를 해결하기 위해 EXAONE Universe는 최신 DB에서 전문 문서를 파악하고 문서 속의 세부적인 근거들을 추론한 후, 서로 다른 근거들을 종합해 인사이트로 만드는 종합적·논리적 추론 기능을 설계했습니다! 따라서 답변의 근거를 자연스럽게 레퍼런스로 제공할 수 있어요 (전문가들이 믿고 쓸 수 있도록 사실적 근거에 집중했어요)
(7월 말에 계열사에게 오픈 된 실제 EXAONE Universe 모델!)
이문태 랩장님은 ‘대형 언어모델에서 hallucination을 어떻게 극복하나요?’라는 질문을 입력한 뒤 어떤 답변을 제시하는지 시연을 진행하였어요. EXAONE Universe는 텍스트 데이터뿐만 아니라 비주얼 데이터를 함께 사용하는 방법과 NLI 자연어 추론 기법을 제안하고, 심층 답변을 요소별로 제시해주었습니다! 추가로 ‘What should we study generative AI?’와 ‘Will AI and automation replace human workers?’라는 질문도 입력해 보았는데요, 여기서 ‘What should we study generative AI?’는 의도적으로 비문으로 작성한 질문이었는데, EXAONE Universe는 ‘why’와 ‘what’을 종합적으로 추론하여 답변을 생성하는 놀라운 결과를 보여주었습니다
새로운 과학적 사실을 탐구하는 EXAONE Discovery
다음으로 EXAONE Discovery입니다! EXAONE Discovery는 새로운 과학적 사실을 탐구하는 서비스 플랫폼으로, AI로 세상에 없던 소재와 신약을 개발하는 것에 가장 먼저 도전하고 있어요(wow). 1단계 이해 영역에서는 논문과 특허 등 전문 문헌에서 데이터와 지식을 추출하는 심층 문서이해 기술을 개발하였고, EXAONE 2.0을 통해 원하는 특성을 가진 분자 구조를 설계하고, 분자간 합성 결과를 예측하는 ‘설계-예측’의 2단계로 현재 고도화 중에 있다고 합니다.
(폭풍 카리스마, 한세희님!)
(새로운 소재 물질을 생성하는 놀라운 데모 시연)
EXAONE Discovery는 Materials Intelligence Lab 한세희 랩장님께서 설명을 이어나가주셨어요. EXAONE Discovery는 신소재, 신약을 발굴하는 과정에서 네비게이션 역할을 해줄 수 있는 플랫폼입니다. 분자를 디자인하고 합성하는 일은 인간 과학자의 고유 영역이었지만, 이제는 AI가 과학자를 도와서 원하는 물질을 빠르게 설계하고, 실험실에서 물리적으로 합성하여 평가해 오던 일을 AI 모델로 손쉽게 예측해 줄 수 있을거라고 해요! 이제 AI가 적은 데이터로 새로운 소재를 개발하는 일까지 척척 해낼 수 있는 시대가 열릴 것이라고 EXAONE Discovery의 비전을 소개해주셨어요
기존의 연구 방식에서는, 연구자들이 이전 연구 결과를 분석하고, 이를 바탕으로 가설을 세운 후, 실제로 소재를 만들어 평가하면서 가설을 검증해왔어요. 이 과정에서 무수한 실험을 진행하고 실패하며, 막대한 시간과 비용이 들죠. EXAONE Discovery의 서비스들은 이 과정을 획기적으로 줄여줍니다! 과학자들이 하나의 문장을 입력하면, 모델이 여러 자료와 복잡한 내용을 검토하고 새로운 소재 개발을 위한 최적의 방법을 제안하여 과학자들은 연구 실패의 리스크를 최소화할 수 있어요!
한세희 랩장님은 최근 환경 이슈로 배터리 첨가제에서 불소 함량을 줄이려는 이슈를 반영해 EXAONE Discovery를 통해 기존 배터리 첨가제를 대체할 새로운 소재를 찾는 데모도 진행해주셨습니다. EXAONE Disocovery가 바꿀 미래가 정말 기대되고 설레는 순간이었어요!
창의적 영감과 아이디어를 제공하는 EXAONE Atelier
마지막으로 창의적 영감과 아이디어를 제공하는 EXAONE Atelier 플랫폼을 소개해드릴게요. EXAONE 2.0 기반의 Atelier는 무려 3억5천만장의 이미지-텍스트 페어 데이터를 학습하였어요! 물론 저작권 문제가 있는 데이터는 전혀 포함시키지 않았어요.
늘 새로운 것을 갈구하는 디자이너들은 EXAONE Atelier를 통해 세상에 존재하지 않았던 이미지를 생성하면서 디자인 컨셉을 구체화할 수 있어요. 자신이 미처 생각하지 못했던 재미있고 참신한 아이디어를 얻고 이를 실제 디자인 작업에 활용하여 제품 제작 시간을 크게 단축시킬 수 있습니다. 창작의 영역에서도 EXAONE 2.0은 훌륭한 파트너가 되는거죠!
(프로 강연자, 승환님의 데모!)
EXAONE Atelier 소개는 Vision Lab 김승환 랩장님께서 진행해주셨어요. EXAONE Atelier에 적용된 Zero-shot Image Captioning 기술을 설명하며, AI가 입력된 이미지에 대해 사람처럼 자연어로 설명하는 것을 넘어 EXAONE 언어모델과 결합하여 사용자가 원하는 Task까지 수행할 수 있다는 장점을 어필했습니다
(LG생활건강의 제품을 위한 실제 광고 문구를 생성해줍니다!)
실제 EXAONE Atelier의 작동 과정을 확인하기 위해, LG 제품 사진을 보여주고 마케팅 문구를 생성해달라는 요청을 넣어 보았어요! EXAONE Atelier는 “당신의 피부와 아름다움을 책임질 최고급 화장품 세트를 소개합니다. 특별한 노하우가 담긴 블루박스 패키지는 당신의 외모와 자신감을 한층 더 업그레이드해 줄 것입니다”라는 화장품 패키지 이미지의 특징을 잘 이해한, 창의적인 광고 카피를 생성하였습니다. 이런 광고 카피뿐 아니라 일반 유저들이 일상 사진을 SNS에 올릴 때 피드 문구 작성 사례와, 그림으로 아이들이 좋아할 만한 창작 동화를 만들어보는 사례도 영상으로 보여주었는데요, 동화는 뒷 이야기가 궁금해질 정도로 정말 흥미로운 내용이었어요!
다양한 인사이트가 오갔던 Q&A Session
(열띈 질문과 답변이 오고 간 Q&A Session)
(EXAONE Lab 이진식 랩장님께서 리드한 데모 공간)
EXAONE 2.0 소개가 마무리된 후에는 Q&A 세션이 진행되었어요. LG AI연구원 배경훈 원장과 더불어 시연을 진행해주신 Vision Lab 김승환 랩장님, Materials Intelligence Lab 한세희 랩장님, Advanced ML Lab 이문태 랩장님, 그리고 Multimodal AI Group 최정규 그룹장님, AI Biz. Development Unit 이화영 유닛장님께서 각 분야에 대해 심도 있는 이야기를 해주셨습니다. 준비된 시간이 모자라 질문을 다 받을 수 없을 정도로 열띤 질문이 많이 이어졌어요
Talk Conert 현장에서는 EXAONE 2.0의 플랫폼을 사용해볼 수 있는 공간도 마련되어 있었어요! EXAONE Atelier를 직접 경험해보며 EXAONE의 놀라운 기술력을 느낄 수 있었습니다.
(LG AI Talk Concert 현장이 궁금하시다면 영상을 통해 확인해보세요!)
LG AI연구원의 EXAONE은 LG 계열사뿐만 아니라 국내 및 글로벌 파트너사와의 협력을 통해 다양한 산업 영역에서 실질적인 성공 사례를 누구보다 먼저 만들어가고 있습니다. 앞으로도 LG AI연구원은 생성형 AI 기술의 대중화에 앞장서며, 대한민국을 넘어 글로벌에서도 경쟁력 있는 AI 연구 개발 기업으로 발전해 나갈 예정이니 계속해서 저희의 여정을 지켜봐주세요
상반기 결산 FLEX MEET-UP!
Talk Concert 당일 오후에는 매달 다 같이 모이는 Meet-up을 진행하였어요! 이 날은 Talk Concert도 무사히 마치고 상반기 결산 기념으로 컬처팀에서 아주 특.별.한. FLEX Meet-up을 준비해주었어요. 파티같이 화려한 스케일의 현장으로 함께 가보시죠!
(오전에 Talk Concert가 진행된 홀에서 다 함께 모였어요-!)
(그냥 밋업이 아닌, 플렉스 밋업)
환영 배너로 찾아 들어간 홀에는 어마어마한 스케일의 밋업이 준비되어 있었어요! 출출한 오후를 위해 준비한 특별한 도시락부터 맥주, 와인, 그리고 칵테일bar 까지 신나는 음악에 연구원들은 모두 열띈 환호와 함께 입장하였어요!
(샌드위치, 닭강정, 과일에 와인 안주까지 기가 막힌 조합)
음료들도 그냥 음료가 아닌, 특별한 에디션을 구하기 위해 컬처팀이 직접 주변 편의점을 모두 돌아다니셨다고 해요! 정말 이토록 열정적인 컬처팀 덕분에 연구원들은 감동, 또 감동
(코카콜라 뉴진스 에디션에!)
(아사히 생맥주캔까지-!)
일일 바텐더 역할을 직접 자청해주신 연구원분들께서 칵테일도 직접 제조해주셨어요 메뉴도 무려 진토닉, 예거밤, 하이볼, 스크류드라이버 4가지나 준비해주셨습니다!
(사장님, 여기 하이볼 하나요-!)
(주문 가능한 음료 설명 중)
(바텐더 언니 너무 멋져요)
(수줍은 웃음은 보너스)
(일일 바텐더님, 굉장히 능숙해보이죠!)
(도시락과 음료를 받고 자리 잡는 연구원분들- 분위기가 정말 좋죠!)
(꽉꽉 채워 알차게 달려보자구!)
자 이제, 본격적으로 상반기 결산 FLEX MEET UP을 시작해볼까요?
특별한 날인만큼 이 날의 Agenda는 입사자 소개부터 shining star 시상, Talk Concert 리캡, 상반기 결산 퀴즈와 타자왕 선발대회까지 다양한 이벤트들이 진행되었어요!
(오늘을 위해 열심히 달려오신 배경훈 원장님!)
(토크콘서트 정말 고생많으셨습니다!)
Talk Concert는 연구원 뿐만 아니라 많은 분들께서 함께 참여한 대형 프로젝트였어요. 배경훈 원장님께서 담당 연구원 중 한 분과 AI Communications Team 팀장님을 모시고 소감을 들어보았는데요, 모두가 한마음으로 정말 힘들게 준비한만큼 좋은 성과를 내어 뿌듯한 하루였다고 합니다
(올해가 반이나 지났다니, 믿기지 않아요)
상반기 결산에는 영상을 빼놓을 수 없죠! 컬처팀에서 지난 6개월간 LG AI연구원이 어떤 활약을 펼쳤는 지 영상을 제작해주셨어요. 고작 반년안에 했다는 게 믿기지 않을 정도로 다양한 연구조직과 팀들의 성과를 함께 보니 괜시리 뭉클해지는 시간이었어요. 모두 너무 고생 많으셨습니다
영상 이후에는 상반기 결산 퀴즈를 진행했어요! 답을 가장 빠르고 정확하게 선택해야하는 온라인 퀴즈였는데요, 퀴즈를 푸는 중에 여기저기서 탄식과 환호과 동시에 들려와 웃음이 빵- 터지는 즐거운 시간이었어요
(손가락 푸시고 준비하세요!)
(1등 축하드립니다!)
자 이제, 마지막으로 대망이 타자대회가 진행되었습니다!
타자대회는 한컴타자 웹사이트에서 단문연습의 기록을 제출해주신 분들을 대상으로 한글 부문, 영어 부문 Top 2를 모시고 진행되었는데요, 1등 상품은 무려 신라호텔의 망고빙수 였어요! 요즘 같이 무더운 날씨에 정말 찰떡인 상품, 놓칠 수 없죠!
(영문 타수가 천타 이상이라니-! 휴먼 맞습니까?)
(e-sports 현장을 연상시키는 무대)
(타자 일등 진행 시켯-!)
(미쿡 언니 망고빙수 타오세요-!)
(빠르게 치고 나갑니다!)
(침착해! 침착하라구!)
(1등 시상식- 다들 축하드려요!)
Talent Relations Team에서는 2명이나 결승전에 진출하여 팀에서 귀여운 플랜카드도 준비해주셨어요 그리고 국문 부문에서도 1등을 당당히 차지하여 돌아왔습니다! (멋져멋져)
상반기 결산 FLEX MEET UP은 이렇게 마무리 되었어요- 맛있는 음식에 신나는 음악, 다양한 이벤트까지 알차게 구성된 오늘의 밋업은 두고두고 기억날 것 같아요 블로그를 통해 즐거움이 여러분께도 잘 전달되었기를 바랍니다! 그럼 다음에도 저희는 즐겁고 신나는 뉴스를 가지고 돌아올게요