BLOG
이것은 Vonage API Platform의 Nexmo에서 음성 및 실시간 처리를 담당하는 제품 디렉터인 Roland Selmer에 의해 게시된 게스트 블로그입니다. Nexmo는 “기업이 문자 메시지, 채팅, 소셜 미디어 및 음성을 통해 고객에게 실시간으로 정보를 쉽게 전달하는 데 필요한 툴을 기업에 제공하여 디지털 고객 경험을 새롭게 할 수 있습니다.
애플리케이션에 통신 기능을 통합할 수 있도록 해주는 클라우드 통신 공급 업체로서, Nexmo, the Vonage API Platform 은 많은 합성 음성 사용 사례를 고객들에게 제공하기 위해 TTS (text-to-speech) 솔루션이 필요했습니다. 우리가 선택한 솔루션은 Nexmo의 글로벌 TTS 제공을 강화하기 위해 우리의 기술 요건과 제품 철학을 충족해야 했습니다.
Amazon Polly 는 이 기준들을 완벽하게 충족시켰습니다. 이 강력한 서비스는 이제 모든 Nexmo의 합성 음성 사용 사례의 주요 엔진으로, 언어와 음성에까지 광범위하게 적용되고 있습니다.
Amazon Polly를 통한 Nexmo 사용 사례
Nexmo에서는 애플리케이션과 사용자 간(A2P)통신을 위한 인터페이스로서 목소리에 대한 믿음이 크며 고객이 주로 Amazon Polly를 백엔드로 사용하여 어플리케이션에서 자연스러운 통신 모드를 구현했습니다. 구체적으로, 다양한 업종의 우리 고객들은 Amazon Polly-powered TTS를 활용하여 다음과 같은 주요 사용 사례를 통해 더 나은 비즈니스 결과를 달성할 수 있었습니다.
– 음성 방송
– 중요 음성 경고
– 인바운드 통화 속삭임
– 2단계 인증에서 핀코드 페일오버 음성 전송
음성 방송:
음성 방송 사용 사례는 Amazon Polly의 확장성과 언어 지원에 따라 달라집니다. 기업은 아웃바운드 TTS 콜을 통해 A2P 마케팅 메시지를 송출함으로써 효율적이고 비용 효과적으로 전 세계의 많은 청중을 사로잡을 수 있습니다.
Nexmo고객의 음성 방송 애플리케이션은 데이터베이스에서 전화 번호 목록을 호출합니다. 이러한 번호가 Nexmo에서 로컬 번호로 프로비저닝 된 경우 모든 통화 수신자는 통화가 시작된 위치에 관계 없이 caller ID로 로컬 번호를 보게 됩니다. 그들이 전화를 받을 때, 그들은 수신자를 위해 개인화된 정보를 포함할 수 있는 TTS 메시지를 듣게 될 것입니다.
중요 음성 경고:
중요 문제에 대한 적절한 대응을 유도하기 위한 TTS 통신의 경우, 고객 서비스 중단에서 내부 비즈니스 문제에 이르기까지, 심지어는 대규모 인구의 안전을 위협하는 극단적인 날씨에도, 음성기반의 중요 경고는 전 세계에 있는 전화를 통해 중요한 메시지를 전달합니다. 고객의 앱은 발생했거나 예정인 상황에 대해 알아야 하는 모든 사용자에게 동시 호출을 시작합니다. 앱은 녹음된 메시지나 문자 메시지를 재생하여 경고를 전달합니다. 그러면 고객은 앱이 수신자에게 수신 확인 키를 누르라고 요구하는 간단한 IVR(대화형 음성 응답)프롬프트를 통해서 누가 메시지를 받았는지 추적할 수도 있습니다.
인바운드 통화 속삭임:
인바운드 통화 속삭임 사용 사례에서, 기업들은 Nexmo 가상 번호를 특정 광고 캠페인과 연결합니다. 잠재 고객이 이 번호 중 하나에 대해 인바운드 통화를 설정하면 기업의 음성 지원 응용 프로그램이 이 번호를 사용 가능한 에이전트에 연결하여 두 사람이 연결하기 전에 발신자가 전화하는 캠페인에 대한 가청 메시지를 재생합니다. 에이전트는 올바른 광고 캠페인 스크립트를 작성하여 적절한 상황에 맞게 발신자의 관심을 유도할 수 있도록 준비할 수 있으며, 이는 보다 효과적인 상호 작용으로 이어질 것입니다.
2단계 인증에서 핀코드 페일오버 음성 전송:
이와 관련하여 가장 주목할 만한 점은, Amazon Polly가 Nexmo의 완벽한 서비스를 위한 2FA 솔루션에서 중요한 역할을 한다는 것입니다. 예를 들어 PIN코드를 앱이나 웹 서비스에 입력하는 잠재 고객에게 전송하는 것과 같이 휴대폰 인증을 통해 새로운 사용자를 인증하는 것 외에, 초기 텍스트 기반 확인 작업이 실패한 경우에는 PIN코드에 대해 음성지원 전송을 사용할 수 있는지 확인하십시오.
저희의 특허 받은 페일 오버 논리를 사용하여 확인은 PIN코드를 음성으로 제공하거나 TTS 메시지를 포함하는 최적의 전송 채널과 페일 오버 시퀀스를 선택합니다.
저희 고객들은 텍스트 전용 솔루션에서 음성 인식 인증 솔루션으로 옮기면서 2GA 변환기에서 큰 성능 향상을 보았습니다. 예를 들어, 비트코인 시장에서 선두주자인 BitQuick은 Nexmo 인증을 사용하여 주문 성공률을 35%에서 55%로 높이고 전체 트랜잭션 기간 중 60일의 배포동안 전체 용량을 두배로 늘렸습니다.
Nexmo 플랫폼은 프로그래밍 방식으로 통신 앱을 늘릴 수 있도록 지원합니다. 이를 통해 개발자가 간단한 IVR 등의 기능을 사용하여 개별 응답과 피드백을 캡처하고 수신자가 전화를 다시 걸거나 음성 메시지를 남기는 비즈니스 로직을 강화할 수 있습니다. Amazon Polly가 제공하는 SSML(음성 합성 마크업 언어) 에 대한 지원을 통해, 개발자들은 더 인간적인 소리를 내기 위해, 애플리케이션의 종합적인 언어의 특성을 조작할 수도 있습니다. 또한 Nexmo Dashboard에 있는 보고서를 사용하여 특정 사용 사례의 효과를 모니터링할 수도 있습니다.
Nexmo에 맞춰 정렬된 Amazon Polly빌딩 블록 모델
Amazon Polly는 Nexmo가 TTS 사용 사례에 필요한 기술 규격의 모든 상자를 확인합니다. 확장성이 뛰어난 AWS Cloud 인프라, Amazon Polly서비스의 고가용성 및 광범위한 언어 지원은 Polly가 논리적인 선택을 하게 만들었습니다. 하지만 Amazon Polly 모델과 Nexmo 모델 사이에는 완벽한 조화를 이루는 철학적인 연관성이 있습니다.
Nexmo가 복잡한 기능을 추상화하고 API를 통해 인프라에 직접 액세스 할 수 있도록 제공함으로써 전 세계 전화를 대중화하듯이, Amazon은 Amazon Polly서비스를 통해 텍스트를 합성 음성으로 변환하는 것을 대중화합니다. AWS는 REST API를 통해 Amazon Polly를 제공함으로써 서비스에 아주 쉽게 통합할 수 있도록 지원하였습니다.
글로벌 플랫폼으로서, Nexmo가 전 세계 고객의 모국어로 TTS사용 사례를 제공하기 위해서는 광범위한 언어 지원이 필수적입니다.
우리의 초당 청구서는 우리의 TTS 고객들에게 제공할 수 있는 또 다른 이점입니다. 우리는 사용하는 것에 대해서만 지불하고 선불 비용을 감당하지 않아도 되기 때문에, 고객들에게 저비용 혜택을 제공할 수 있습니다.
기업들이 고객과 의사 소통을 하기 위해 음성 인터페이스를 사용하는 경우가 점점 더 많아짐에 따라, 우리는 Amazon Polly를 우리의 엔진으로 사용하여 그들의 텍스트 음성 변환 사용 사례를 지원하는데 만반의 준비가 되어있습니다.
원문 URL: https://aws.amazon.com/ko/blogs/machine-learning/amazon-polly-powers-nexmos-next-gen-text-to-speech-use-cases/
** 메가존 TechBlog는 AWS BLOG 영문 게재글중에서 한국 사용자들에게 유용한 정보 및 콘텐츠를 우선적으로 번역하여 내부 엔지니어 검수를 받아서, 정기적으로 게재하고 있습니다. 추가로 번역및 게재를 희망하는 글에 대해서 관리자에게 메일 또는 SNS페이지에 댓글을 남겨주시면, 우선적으로 번역해서 전달해드리도록 하겠습니다.