BLOG

도요타 연구소는 AWS에서 세계적인 규모로 심층 학습을 통해 안전하고 자동화된 주행을 가속화합니다.
작성일: 2018-07-10

자율 주행 차는 사회에 많은 혜택을 가져다 줄 수 있습니다. 도요타 연구소(TRI)의 최우선 과제 중 하나는 최신 인공 지능(AI) 기술을 적용해 도요타가 보다 안전하고 접근성이 뛰어나며 환경친화적인 자동차를 만드는 것입니다. TRI가 목표를 달성하도록 돕기 위해, 그들은 AWS(Amazon Web Services)에서 심층 학습으로 눈을 돌렸습니다.

 

TRI는 Amazon EC2 P3인스턴스를 사용하여 이전에 사용했던 P2 인스턴스보다 4배 더 빠른 훈련 시간을 확인하여 훈련 시간을 며칠에서 몇 시간으로 단축했습니다. 따라서 그들은 모델을 신속하게 최적화 및 재훈련하고 추가 테스트를 위해 테스트 차량 또는 시뮬레이션 환경에 모델을 구현할 수 있는 뛰어난 민첩성을 확보할 수 있습니다. 또한 P2 인스턴스에 비해 P3 인스턴스의 성능이 크게 향상되었으며 AWS 종량제 모델을 통해 TRI의 운영 비용이 절감되었습니다.

 

자동 주행을 위한 심층 학습 모델 개발

 

TRI는 Guardian과 Chauffeur라는 두가지 모드로 자동화된 주행 기술을 위한 단일 기술 스택을 개발하고 있습니다. Guardian 모드에서는 운전자가 항상 휠에 손을 대고 도로를 주시해야 하며, 필요한 경우에만 즉, 잠재적 충돌을 감지할 때만 개입하여 운전 환경을 내부 및 외부에서 지속적으로 모니터링 해야 합니다. Chauffeur 모드는 동일한 기술을 사용하지만 항상 제어가 가능하며, 차량 탑승자는 엄격히 승객만 가능합니다.

 

자율 차량을 개발하고 배포하려면 대량의 데이터를 수집, 저장 및 관리할 수 있는 능력, 고성능 컴퓨팅 용량 및 차량에서 실시간으로 처리할 수 있는 기능을 포함한 고급 심층 학습 기법이 필요합니다.

 

PyTorch 심층 학습 프레임워크를 사용하여 TRI는 두가지 주행 모드 모두에서 자동으로 모니터링과 제어를 제공하는 심층 학습 컴퓨터 비전 모델을 개발했습니다. 심층 학습 모델에 사용되는 데이터를 수집하기 위해 TRI는 카메라, 레이더, LIDAR(3D 공간에서 객체 표현을 생성하기 위해 제어 및 탐색에 사용되는 기술)와 같은 다양한 종류의 데이터 획득 센서를 장착한 테스트용 차량입니다. 이 테스트 차량은 다양한 ODD(운영 설계 도메인)를 통해 주행하며, 데이터를 수집하고 기록합니다. 데이터는 차량당 하루에 테라바이트에 달합니다. 이 데이터는 신속하게 검색되고, 사전 준비되며, 기계 학습 모델과 시뮬레이션의 분석과 재훈련에 사용할 수 있어야 합니다.

 

TRI는 모델을 정확하게 훈련시키려면 수 조마일의 시험이 필요하다고 생각합니다. 오늘날 1억대 이상의 도요타 자동차들이 길에 있으며, 운전자들은 다양한 운전 조건을 경험합니다. 차량 테스트를 보완하기 위해 TRI는 시뮬레이션을 사용하여 다양한 희귀 조건과 시나리오를 모델링합니다. 이러한 시뮬레이션은 기계 학습 모델이 다양한 도로 표면, 환경을 가진 상태에서 낮과 밤의 다른 시간대에 따라 폭풍우, 눈보라, 그리고 눈부신 섬광과 같은 까다로운 사례에 어떻게 반응하는지 테스트하는 포토 리얼 데이터 스트림을 생성합니다.

 

새로운 테스트 데이터가 제공됨에 따라 TRI는 빠르게 리서치 아이디어를 탐구하고 모델을 훈련하여 테스트 차량에 업데이트된 버전을 배포하고 테스트를 다시 실행할 수 있습니다.

 

“Amazon EC2 P3 인스턴스를 사용하여 모델 훈련 시간을 75%나 단축했습니다. 따라서 새로운 데이터를 빠르게 통합하고 모델을 재훈련시키며, 아이디어를 탐구하고, 모델 정확도를 높이며, 새로운 기능을 신속하게 도입할 수 있으므로 연구 및 개발 속도가 크게 향상됩니다.”라고 도요타 연구소의 기계 학습 팀장인 Adrien Gaidon 박사가 말했습니다.

 

다음 그림은 TRI 테스트 차량의 데이터 수집 흐름을 보여 줍니다. 테스트를 마치고 돌아온 차량은 차량에서 SSD(Solid State Drive)를 꺼내 로컬 NAS(네트워크 연결 스토리지)에 데이터를 업로드하는 수집 시스템에 넣습니다. 그런 다음 데이터는 즉시 Amazon S3 데이터 레이크에 업로드되고 다른 사이트는 Amazon S3 이벤트로 채워진 Amazon SQS 대기열을 수신하며 데이터는 여러 사이트에서 동기화됩니다.

 

흥미로운 데이터 포인트가 포함된 업로드된 데이터 조각을 사용하여 TRI의 심층 학습 모델을 재훈련시킬 수 있습니다. 또한 이 데이터는 모든 테스트 시나리오를 업데이트하기 위해 시뮬레이션 환경에 제공됩니다.

 

 

클라우드 기반 심층 학습

 

TRI는 대량의 데이터를 처리할 수 있고, 기계 학습 모델을 신속하게 훈련하는 데 필요한 처리 능력을 갖추고 있으며, 요구 사항에 맞게 확장할 수 있는 IT 플랫폼이 필요했습니다. AWS를 사용하여 필요에 따라 컴퓨팅 및 스토리지 리소스를 스핀업하고 더 높은 수준의 관리 및 조정 서비스와 결합할 수 있습니다. 이를 통해 TRI의 개발 팀은 대량의 데이터에 대한 실험을 실행할 수 있는 신속한 R&D사이클을 구현할 수 있는 민첩성을 제공합니다.

 

TRI는 Amazon S3를 사용하여 어디에서나 데이터를 저장 및 검색하고 Amazon SQS를 사용하여 원격 데이터 수집 사이트 간의 데이터 전송을 조정합니다. TRI가 기계 학습 모델 훈련을 가속화하는 데 필요한 핵심 컴퓨팅 기능은 NVIDIA의 최신 테슬라 V100 GPU가 탑재된 여러 Amazon EC2 P3 인스턴스를 통해 제공됩니다. P3 인스턴스는 클라우드에서 사용할 수 있는 가장 빠른 GPU 인스턴스 중 하나입니다. 몇 시간 또는 몇 분 만에 모델 훈련 시간을 단축하여 데이터 과학자와 기계 학습 엔지니어가 더 빠르게 반복하고, 더 많은 모델을 훈련하며, 애플리케이션에 경쟁력을 갖추도록 지원합니다.

 

“AWS Cloud, 특히 Amazon EC2 P3 인스턴스를 사용하여 확장 가능하고 성능이 뛰어난 애플리케이션 스택을 구축하여 수집한 방대한 양의 데이터를 효율적으로 처리할 수 있습니다.”라고 도요타 연구소의 인프라 엔지니어링 팀장인 Mike Garrison이 말했습니다.

 

TRI는 Amazon EC2 P3 인스턴스, Amazon S3, Amazon SQS 및 AWS 네트워킹 서비스에서 심층 학습을 통해 개발 팀이 신속하게 진행하고 교통 사고나 사망자 없이 미래를 향해 접근할 수 있도록 도요타가 더 안전한 자동차를 생산하기 위해 인공 지능을 적용하겠다는 그들의 원대한 비전을 제공할 수 있는 확장 가능한 솔루션을 구축했습니다.

 

AWS에서 기계 학습을 수행하는 방법Amazon EC2 P3 인스턴스를 통해 AI 이니셔티브를 확장하는 방법에 대해 자세히 알아보십시오.

 

원문 URL: https://aws.amazon.com/ko/blogs/machine-learning/toyota-research-institute-accelerates-safe-automated-driving-with-deep-learning-at-a-global-scale-on-aws/

** 메가존 TechBlog는 AWS BLOG 영문 게재글중에서 한국 사용자들에게 유용한 정보 및 콘텐츠를 우선적으로 번역하여 내부 엔지니어 검수를 받아서, 정기적으로 게재하고 있습니다. 추가로 번역및 게재를 희망하는 글에 대해서 관리자에게 메일 또는 SNS페이지에 댓글을 남겨주시면, 우선적으로 번역해서 전달해드리도록 하겠습니다.