SEMINAR

[Event] 인공지능위크2023 참관기
작성일: 2023-07-28

지난 7월 14일 코엑스에서 열린 인공지능위크에 메가존클라우드 Cloud Technology Center내 AI/ML팀 김지호, 고은별 매니저님께서 다녀오신 내용을 게시글로 공유 드리고자 합니다.

 

 

인공지능위크2023은 과학기술정보통신부와 Google이 함께 개최한 행사로 현업 종사자 및 학계 연구자 부터 인공지능 분야로 취업을 희망하는 학생까지 인공지능과 머신러닝에 관심을 가지고 있는 대한민국의 모든 디지털 인재를 위해 마련된 컨퍼런스 입니다.

 

 

이번 컨퍼런스에서는 인공지능 및 러신머닝 관련한 최신 기술과 연구 결과를 소개하는 다양한 세션들이 마련되었는데요, 그 중에서도 Google I/O 23에서 발표된 내용을 기반으로 AI/ML 등 개발자를 위한 Google의 최신 기술에 대해 소개하는 세션에 참여한 내용을 중심으로 소개 드리고자 합니다.

 

 

 

 

1. Intro to LLM with the PaLM API

 

 

AIWEEK2023_review_1

 

 

“구글은 인공지능 개발에 있어서 지금 굉장히 중요한 터닝 포인트에 서있다” 고 언급하면서 연구에 그치는 게 아니라, 그동안 축적된 AI 기술을 사용자, 기업이 활용할 수 있도록 모두에게 유용한 제품을 선보이고자 하였습니다.

 

 

PaLM 2 는 다국어, 추론 코딩 능력을 월등히 향상해서 내놓은 최신 언어모델로, 현재 25개 이상의 구글 제품에 사용되고 있는데요, 다국어 지원, 추론, 복잡한 연산 및 코딩까지도 가능하며. 텍스트뿐만 아니라 이미지 등 시각적인 요소도 포함됨. ‘구글 렌즈’ 기능을 활용해 질문을 할 때 직접 사진을 삽입할 수도 있고, 답변도 사진으로 받을 수 있습니다.
Bard에는 구글의 최신 대규모 언어 모델(LLM) 팜2(PaLM 2)가 탑재되었다고 합니다.

 

 

 

 

2. Google의 생성형 AI Bard

 

 

인공지능(AI) 챗봇 ‘바드'(Bard)에 대한 소개 세션
Speaker : 최현정, Director, Bard engineering / Google

 

 

AIWEEK2023_review_2

 

Bard는 구글이 개발한 거대언어모델(LLM) Palm2 기반의 대화형 AI (=인공지능 챗봇)로 지난 5월 열린 구글 연례 개발자회의(I/O)에서 영어로 서비스되는 Bard에 이어 한국어와 일본어 버전이 공개되었습니다.

 

 

2023년 07월 13일 부로 아랍어, 중국어, 독일어, 힌디어 스페인어를 포함하여 40개 이상의 언어로 Bard와 협업할 수 있으며, 유럽 전역을 포함해 더 많은 곳에서 Bard에 액세스 가능하다고 합니다.

 

 

다양한 기능을 제공하여 생산성 향상과 맞춤형 응답을 제공하는데 특화되어있는데요, 상세하게 살펴보면 Bard의 답변을 구글 지메일이나 구글 스프레드시트로 내보내 저장하는 기능 추가되었고, Bard의 응답 톤과 스타일을 지정할 수 있으며, 드롭다운 기능을 활용해 응답을 줄일 수 있습니다. 또한 음성 응답 기능 제공하며, 더 많은 곳으로 코드 내보내기가 가능합니다.(답변 결과를 Google Colab 및 Replit과 같은 IDE로 내보낼 수 있음) 마지막으로 프롬프트에 이미지 사용도 가능합니다.

 

 

Bard의 개발 여정에 대해서도 들어볼 수 있었는데요, Bard 개발에서 가장 중요한 부분은 사용자의 피드백을 반영하는 것이었다고 합니다.

 

 

추후 많은 사용자가 사용할수록 양질의 대답을 출력할 수 있으므로, 답변에 대한 사용자의 피드백이 매우 중요한데요, 이에 RLHF(Reinforcement Learning from Human Feedback) 방식을 이용해, human feedback으로부터 LM을 optimize하는 방식으로 output을 사람이 원하는 방식에 가깝도록 최적화하였다고 합니다. 사용자는 Bard가 내놓은 답변 아래에 있는 ‘맘에 들어요’, ‘맘에 들지 않아요’ 버튼을 클릭해 답변 품질평가를 할 수 있게 되어있습니다.

 

 

다만, LLM은 완벽하지 않습니다. 그래서 Bard가 때로는 부정확하거나 왜곡된 정보를 내놓는 경우가 있는데요, 사용자가 관련 내용을 검색해보며 답변을 다시 확인할 수 있도록, 구글에서 검색버튼을 Bard UI에 포함시켰습니다. (사용자가 Bard의 결과값을 구글 검색을 통해 검증할 수 있습니다.)

 

 

조만간 40여 개의 언어로 180여 개국에 선보일 예정이며, 이미지 정보를 이해하고 이미지를 추가한 답변을 생성하는 기능도 한국어로 출시할 예정이라고 합니다.

 

 

이전에는 언어권별로 AI 챗봇을 구축해야 했다면, 이제는 LLM 모델이 개발되면서 성능/ 효율성 면에서 놀라운 발전이라고 보여집니다.
Bard는 대화형 챗봇이라, “좋은 대화/유용한 대화” 에 대한 평가방법을 만드는 것에 대한 고민이 있었고, 어느 수준에 이르러야 사람들에게 좋은 서비스를 제공할 수 있을지에 대한 고민도 역시 있었다고 합니다.

 

 

초기 영어 서비스를 론칭하며 많은 고민이 해결됐다고 생각했지만, 추후 한국어와 일본어 서비스를 론칭하며 “좋은 대화/유용한 대화/ 유용한 정보/유용하지 않은 정보…” 가 각 언어권/문화권마다 너무 다른 것을 깨닫게 되면서 깊이 있게 문화와 언어별 뉘앙스를 이해하고 평가하는 과정을 거치게 되었습니다.

 

 

여담으로 연사 최현정 (Director, Bard engineering / Google) 님께서는 Bard의 한국어 버전을 출시하기 전 며칠 밤을 설칠 정도로 매우 긴장하셨다고 하는데요, 이 때 Bard출시 전, 본인의 생활 패턴을 기반으로 한 운동 루틴을 Bard에게 물어봤을 때, 좋은 답변이 나온 것을 보고 굉장히 안심이 되었다고 합니다.🙂

 

 

 

 

3. 생성 AI 와 디지털 휴먼 기술

 

 

생성형 AI가 콘텐츠 생성 업무에 어떻게 활용되는지와 차세대 가상 인간으로서의 인터렉티브 디지털 휴먼 기술을 소개하는 세션
Speaker : 이연수, NLP센터장, 상무 / NCSOFT

 

 

3-1 ) 게임을 위한 생성형 AI

 

 

본 세션에서는 게임 산업에서 생성형 AI가 어떻게 활용될 수 있는지 알아보았습니다. 깊이 있는 상호작용이 가능한 NPC 생성을 할 수 있는데요, 예를들어 대화 생성 AI, 음성 인식/생성 AI 등을 활용한 디지털 휴먼 생성 등이 가능하다고 합니다.

 

 

AIWEEK2023_review_3

 

 

 

AIWEEK2023_review_4

 

 

 

AIWEEK2023_review_5

 

 

 

AIWEEK2023_review_6

 

 

생성 AI가 Artist들의 생산성 향상에 기여하게 되는데 캐릭터, 세계관, 장소 등의 설정을 AI와 함께 창작하거나, 생성된 캐릭터를 불러와 AI로 대사를 생성,편집,완성하여 기여하기도 합니다.

 

 

AIWEEK2023_review_7

 

 

AIWEEK2023_review_8

 

 

 

AIWEEK2023_review_9

 

 

 

AIWEEK2023_review_10

 

 

3-2) 디지털 휴먼

 

 

디지털 휴먼이란 인간의 언어와 몸짓을 구현할 수 있는 AI 기반 가상 휴먼인데요, 게임 업계에서 많은 인력과 시간, 비용을 필요로 했던 디지털 휴먼 제작 환경이 AI 도입으로 인해 개선되고 있습니다.

 

 

AIWEEK2023_review_11

 

AIWEEK2023_review_12

 

 

 

AIWEEK2023_review_13

 

 

AIWEEK2023_review_14

 

 

AIWEEK2023_review_15

 

 

 

디지털 휴먼관련하여 많이 언급되는 불쾌한 골짜기 관련한 이야기도 있었는데요, 예를들어 웃으면서 이야기할 때 어느 부분에서 웃어야 할지 등에 대한 문제가 있습니다. 이러한 문제들은 여러 영상 데이터를 사용하여 학습하고 있으며, 현재 얼굴 표정 및 입 모양은 보기 어색하지 않을 정도로 많이 좋아진 상태라고 합니다.

 

 

그렇지만, 아직 사람이 보기에 어색한 부분이 있을 수 있어, 사람뿐만 아니라 캐릭터도 연구 중에 있다고 합니다.

 

 

AIWEEK2023_review_16

 

 

하나의 큰 모델만 사용하는 것이 아닌 여러 모델을 다양하게 사용합니다.

 

 

AIWEEK2023_review_17

 

 

그리고 게임분야를 넘어 다른 분야로 확장 중이고, 발표를 진행 하신 엔씨소프트에서 현재 대규모 언어 모델 발표 고려중이라고 하니 많은 기대가 됩니다.

 

 

AIWEEK2023_review_18

 

 

하나의 페르소나를 위해 필요한 데이터는 보통 테스트 데이터로 2만건 이상 사용됩니다. 자연스러운 대화를 위해 말투, 어조에 집중하여 개발하고 있다고 합니다.

 

 

AIWEEK2023_review_19

 

 

AIWEEK2023_review_20

 

 

 

AIWEEK2023_review_21

 

 

4. 인공지능위크 2023을 참관하면서 느낀 소감

 

 

김지호 매니저✨

 

Google Bard 관련
최근 챗 GPT에 대응할 다양한 생성형 AI 의 등장과 함께 한국어 버전(한국어 모델) 이 출시되고 있습니다. 평소 개인적으로 한국어 자연어처리에 관심이 많은데요, 구글의 생성형 언어모델인 Bard, 그 중 한국어 버전의 출시 과정에 대해서 실무진의 이야기를 들을 수 있어 매우 흥미로웠던 세션이었습니다.

 

 

특히 연사 최현정 (Director, Bard engineering / Google) 님께서는 11년 넘게 자연어 처리 분야에 계시며, 한국어 Bard를 구축할 때 맞닥트렸던 현실적인 문제 (환각, 평가지표 선정, 문화&언어권별 특징 파악 등) 관련하여 이야기 해주신 부분이 인상깊었습니다. 언어 모델에 있어서 평가 지표란 매우 주관적이며, 사용자의 피드백을 통해 계속해서 성능을 개선해 나가는 것이 최선이라고 언급한 부분이 그러합니다. 따라서 AI모델 개발 및 구축은 서비스에 있어서 끝이 아닌 시작이며, 모델 개발 후 유지보수 및 모니터링 부분에 있어 엔지니어의 주관적 판단이 끊임없이 필요하고, 그런 과정에서 AI 엔지니어 역량의 중요성 및 AI 윤리에 대해서 생각해볼 수 있었습니다.

 

 

추가로 Bard를 사용해보며 제가 느낀 ChatGPT 와 Bard의 차이점은 다음과 같습니다.

 

  1. Bard는 ChatGPT에 비해 사실에 관련된 답변에 더 잘 작동하는 반면, ChatGPT는 노래 가사, 시, 편지 등과 같이 생성하는 답변에 대해서 더 잘 작동한다고 느꼈습니다.
  2. Bard는 사용자의 질문/답변을 구글 스프레드 시트와 같은 구글 워크스페이스로 출력하여 저장할 수 있습니다.
  3. 기타 부스 참여 내용
    a. 참석자가 인공지능과의 대화를 통해 기분을 분석해 44가지의 향료를 조합하여 기분에 맞는 향을 제공하는 긱블의 “AI퍼퓨머” 를 체험했습니다. 저는 인공지능과의 대화를 통해 “행복한 날들” 이라는 키워드가 출력되어, 해당 키워드를 기반으로 한 향수를 만들었습니다. 매우 달콤한 향이 나와서 기분 좋은 경험이었습니다.

 

AIWEEK2023_review_22


AIWEEK2023_review_23

 

 

 

고은별 매니저✨

 

Google Bard

 

AIWEEK2023_review_24

 

Bard는 Google의 Foundation Model인 PaLM2를 사용자가 직접 사용할 수 있는 버젼입니다. (PaLM2는 현재 25개 이상의 구글 제품에 실제로 사용되고 있다고 합니다.)

 

행사 이후 Google Bard를 OpenAI가 개발한 ChatGPT와 비교해 보았습니다. 두 모델 모두 방대한 텍스트와 데이터셋으로 학습된 대규모 언어 모델이지만 사용자 입장에서 가장 크게 느껴지는 차이점은 답변 방식이라고 생각했습니다.

 

 

Bard는 하나의 프롬프트에 답변(드래프트)를 여러 개 제시하고 ChatGPT는 하나의 질문에 하나의 답변만 제시하는 경향이 있어 보였습니다. 또한, ChatGPT 같은 경우 프롬프트에 대한 응답을 사실과 스토리로 만들어서 답변하므로 창의적인 답변에 능한 반면, Bard 같은 경우 구글 검색엔진 데이터를 바탕으로 사용자에게 조금 더 정확한 데이터를 제공할 수 있습니다.

 

 

개인적인 사용감으로는 Bard가 최신 정보를 제공한다는 점과 비교적 정확하고 포괄적인 응답을 제공한다는 점이 조금 더 매력적으로 느껴 졌습니다. 지속적으로 발전하고 있는 분야이므로 특정 모델이 특정 영역에서의 입지가 확실하다고 말하기는 어렵지만, 두 모델의 특장점이 있으므로 사용 목적에 맞게 활용한다면 좋을 것 같다고 생각했습니다.

 

 

칼로(Karlo) : 카카오 이미지 생성 AI

 

17일, 카카오브레인에서 새롭게 출시한 이미지 생성 AI 칼로 2.0을 인공지능위크 부스의 데모 시연을 통해 먼저 경험해볼 수 있었습니다. 칼로 2.0은 이전 버전에 비해 실사에 가까운 고품질 이미지를 구현할 수 있게 업그레이드 되었으며, UX를 보다 직관적으로 개편하여 사용자가 프롬프트, negative 프롬프트를 직접 입력할 수 있게 UI를 구성해 두었습니다. 생성 이미지를 자연스럽게 확장할 수 있는 Outpainting 기능과 특정 영역을 새로운 이미지로 변경하는 Inpainting기능을 활용해 이미지의 수정 및 보완이 가능하다는 특징이 있었습니다.

 

 

AIWEEK2023_review_25

 

행사 참여 이후 실제로 동일한 프롬프트를 적용해 칼로의 기존 모델과 2.0 모델을 비교해보았습니다.

 

 

Prompt : A maltese riding a motorcycle across the beach with sunglasses on

 

 

 

기존 모델

 

AIWEEK2023_review_26

 

 

칼로 2.0

 

 

 

기존 버젼에 비해 생성되는 사진이 조금 더 자연스러워졌으며 풍경, 동물 사진에 대해 강점을 가지는 듯 합니다.

 

 

Google AI 연구팀이 개발한 Text to Image Generative AI 모델인 Stable Diffusion과 비교해 보았을 때 특정 모델이 더 성능이 좋다고 얘기하기는 어렵지만, Stable Diffusion 모델 같은 경우 창의적이고 독창적인 이미지 생성에 강점이 있는 모델이고 국내 개발 모델인 Karlo2.0 같은 경우 사실적이고 세부적인 이미지 생성에 조금 더 강하다고 말할 수 있을 것 같습니다.