BLOG
Amazon SageMaker Ground Truth를 사용하면 기계 학습(ML)을 위한 매우 정확한 교육 데이터 세트를 신속하게 구축할 수 있습니다. Ground Truth는 타사 및 사용자 라벨에 쉽게 액세스할 수 있으며 일반적인 라벨 작업을 위한 내장 워크 플로우 및 인터페이스를 제공합니다. 또한 Ground Truth는 자동 라벨링을 사용하여 라벨링 비용을 최대 70 %까지 낮출 수 있습니다. 자동 라벨링은 서비스 담당자가 데이터에 독립적으로 라벨을 지정하는 방법을 학습할 수 있도록 데이터 사람이 라벨링한 Ground Truth를 교육하여 작동합니다.
시맨틱 세그먼테이션은 이미지의 개별 픽셀에 클래스 레이블을 할당하는 컴퓨터 비전 ML 기술입니다. 예를 들어, 움직이는 차량에 의해 캡처된 비디오 프레임에서 클래스 레이블은 차량, 보행자, 도로, 교통 신호, 건물 또는 배경을 포함할 수 있습니다. 이미지에서 다른 물체의 위치를 정확하게 이해하고 자율 주행 차량이나 로봇 공학에 대한 인식 시스템을 구축하는 데 종종 사용됩니다. 시맨틱 세그먼테이션을 위한 ML 모델을 구축하려면 먼저 픽셀 레벨에서 많은 양의 데이터에 레이블을 지정해야합니다. 이 라벨링 프로세스는 복잡합니다. 숙련된 레이블러와 상당한 시간이 필요합니다. 일부 이미지는 정확하게 레이블을 지정하는 데 최대 2시간이 걸릴 수 있습니다.
Ground Truth는 라벨링 처리량을 높이고 정확성을 개선하며 라벨러 피로를 완화하기 위해 시맨틱 세그먼트 라벨링 사용자 인터페이스에 자동 세그먼트 기능을 추가했습니다. 자동 세그먼트 도구는 최소한의 입력만으로 이미지에서 관심 영역에 자동 레이블을 지정하여 작업을 단순화합니다. 자동 세그먼트의 결과 출력을 승인, 실행 취소 또는 정정할 수 있습니다. 다음 스크린 샷은 툴바의 자동 세그먼트 기능을 강조 표시하고 이미지에서 개를 개체로 캡처한 것을 보여줍니다. 개에게 할당된 라벨은 Bubbles입니다.
이 새로운 기능을 사용하면 시맨틱 분할 작업에서 최대 10배 빠르게 작업할 수 있습니다. 꼭 맞는 다각형을 그리거나 브러시 도구를 사용하여 이미지의 객체를 캡처하는 대신 객체의 맨 위, 맨 아래, 가장 왼쪽, 가장 오른쪽에 하나씩 점을 그립니다. Ground Truth는이 네 가지 점을 입력으로 취하고 DEXTR (Deep Extreme Cut) 알고리즘을 사용하여 물체 주위에 딱 맞는 마스크를 만듭니다. 다음 데모는 이 도구가 보다 복잡한 라벨링 작업의 처리 속도를 높이는 방법을 보여줍니다(비디오는 실시간 속도로 5 배 재생).
결론
오늘 블로그 포스팅에선 시맨틱 세그먼테이션(semantic segmentation)이라 불리는 컴퓨터 비전 ML 기술의 목적과 복잡성을 설명했습니다. 자동 세그먼트 기능은 라벨러의 입력을 최소화하여 이미지에서 관심 영역의 세그먼트를 자동화하고 시맨틱 세그먼트 레이블링 작업의 속도를 높입니다.
** 메가존 클라우드 TechBlog는 AWS BLOG 영문 게재 글 중에서 한국 사용자들에게 유용한 정보 및 콘텐츠를 우선적으로 번역하여 내부 엔지니어 검수를 받아서, 정기적으로 게재하고 있습니다. 추가로 번역 및 게재를 희망하는 글에 대해서 관리자에게 메일 또는 SNS 페이지에 댓글을 남겨주시면, 우선적으로 번역해서 전달해드리도록 하겠습니다.