독립 행정 기관, 독립적 인 행정 기관, 국립 선진 산업 과학 및 기술 연구소 [Yoshikawa Hiroyuki의 회장] 정보 기술 연구 부서 [Sekiguchi Tomotsugu 회장 Sekiguchi Tomotsugu] 미디어 상호 작용 그룹 [의장 Asano Tai] Goto Masataka의 수석 연구원 및 Ogata jun reserative reporative)음성 정보 검색인터넷에서 바카라 사이트할 수있는 기술 및 일본어 음성 데이터가 개발되었습니다 (팟 캐스트)전체 텍스트 검색 서비스"Podcastle(Podcastle) "(http : //podcastlejp) 2008 년 6 월 12 일에 공개 될 예정이며 시연 실험이 시작됩니다
현재 음성 인식 기술은 인터넷에서 다양한 음성 데이터를 인식 할 때 많은 잘못된 인식을 가지고 있으며, 다시 한번 나타납니다새 단어 (일반 명사, 유행어 등)와 호환되지 않습니다 따라서 음성 정보 검색 시스템을 구현하더라도 적절한 검색 결과를 얻기가 어려웠습니다
이번에는 AIST가 지정되지 않은 수의 바카라 사이트자가 간단한 작업으로 오해를 수정할 수있는 새로운 인터페이스를 개발했습니다 수정 결과를 배우고 반영함으로써 음성 검색 성능과 음성 인식 성능을 모두 향상시킬 수있었습니다 게다가,인터넷에서 뉴스 기사, 사전 등에서 새로운 단어를 자동으로 배울 수있는 기술을 개발했습니다
이 웹 서비스Podcastleを通じて性能が向上していく音声認識技術は、ロボットやコールセンター、会議議事録作成等のさまざまな分野へ応用されることが期待される。
이 결과는 6 월 14 일부터 15 일까지 National Kyoto International Hall에서 개최 될 7 차 산업-아카데미 정부 협력 홍보 회의 (캐비닛 사무소 등)에서 시연되고 전시 될 것입니다

인터넷의 데이터 양이 증가했으며 정보 검색은 사회에 필수적인 기술이되었습니다 텍스트 (문자) 데이터를 검색 할 때 많은 웹 서비스가 게시되며 키워드를 입력하여 전체 텍스트를 검색 할 수 있습니다
그러나 최근 몇 년 동안 오디오 버전 블로그로 알려진 오디오가 포함 된 팟 캐스트 및 비디오는 인터넷에서 빠르게 증가하고 있으며 오디오가 포함 된 데이터를 검색하는 정보가 실제적으로 바카라 사이트되기를 희망합니다 텍스트 데이터와 달리 음성 데이터는 색인으로 바카라 사이트할 수 없으므로 전체 텍스트 검색 서비스를 실현하기 위해 음성 인식을 바카라 사이트하여 텍스트 변환 (전사)이 필요합니다 그러나 기존의 음성 인식 기술은 많은 잘못된 인식을 일으켰으며 새로운 단어를 수용 할 수 없었으므로 인터넷에서 다양한 음성에 대해 실질적으로 정확한 음성 정보 검색 서비스를 제공 할 수 없었습니다
AIST는 컴퓨터가 인간의 "음성"을 이해하고 편안한 사회를 실현하기 위해 음성 인식 시스템, 음성 인터페이스, 대화 로봇 및 기타 프로그램을 연구하고 개발하고 있습니다
지금까지 연구 개발의 축적은 바카라 사이트자 협력시 성능을 향상시키는 음성 정보 검색 시스템에 대한 아이디어로 이어졌습니다 이 아이디어를 기반으로 한 시스템은 2006 년 12 월부터 연구원을 위해 베타 버전으로 출판되었지만 이제는 다양한 기능을 완료하고 웹 서비스로 공개되었으며 데모 실험을 시작하기로 결정했습니다
또한,이 연구의 일부는 과학 연구를위한 과학 보조금 촉진을 위해 일본 사회에 의해 부여되었습니다 (주제 번호 19300065)
AIST는 지정되지 않은 바카라 사이트자 수의 협력을 통해 성능을 향상시키는 음성 정보 검색 시스템을 개발했으며 인터넷에 존재하는 일본 팟 캐스트를 대상으로하는 "Podcastle(Podcastle) "(http : //podcastlejp)로 게시Podcastle다음 세 가지 기능이 있습니다
1 웹에서 일본 팟 캐스트에 대한 전체 텍스트 검색
팟 캐스트는 블로그의 오디오 버전과 동일하며 개인과 그룹이 쉽게 게시 할 수 있으므로 숫자는 계속 증가하지만 전통적으로 전체 텍스트 일본 팟 캐스트를 검색 할 수있는 웹 서비스는 없으며 오디오에 특정 키워드가 포함 된 팟 캐스트를 찾는 것은 불가능했습니다 이번에는 책Podcastle(Podcastle) 서비스에 대한 액세스를 통해 누구나 그러한 음성 검색을 무료로 수행 할 수 있습니다
이 서비스는 매일 팟 캐스트를 자동으로 수집하여 음성 인식 (자동 전사)을 바카라 사이트하여 인덱싱 된 다음 그림 1의 예제 화면에 표시된 것처럼 바카라 사이트자가 입력 한 검색 키워드와 일치하여 전체 텍스트 검색 결과를 표시합니다 각 검색 결과에서 키워드 주변의 음성 인식 결과가 표시되며 실제로 원래 사이트의 오디오를 듣고 확인할 수 있습니다
2 새로운 단어 (적절한 명사, 유행어 등)를 자동으로 배웁니다
우리는 인터넷의 뉴스 기사 및 사전에서 전통적인 음성 인식을 바카라 사이트할 수 없다는 새로운 단어 (새로운 단어, 현재 이벤트, 유명인 이름 등)를 자동으로 배우는 새로운 기술을 개발했습니다 현재 음성 인식 사전에 단어가 추가되었을뿐만 아니라 그 전후에 연결 (컨텍스트)을 배웠으므로보다 정확하게 인식 할 수있었습니다 팟 캐스트는 종종 "서브 프라임 대출", "IPS 셀"및 "TASPO"와 같은 새로운 단어를 바카라 사이트하지만이 새로운 단어도 포함됩니다Podcastle컨텐츠를 자동으로 인식 한 최초의 사람이되었습니다 과거에는 이들은 수동으로 음성 인식 사전에 추가 할 수 있었지만 "미국 서브 프라임 모기지 문제"와 같이 그 전후에 연결을 배우는 데 혼자를 허용 할 수 없었으며 인식 성능이 좋지 않을 수 있습니다Podcastle우리는 또한 이러한 연결을 자동으로 배웠으므로 정확한 인식을 허용합니다
3 바카라 사이트자가 더 많이 협력할수록 음성 검색 및 인식의 성능이 향상됩니다
팟 캐스트에는 다양한 녹음 조건이있는 오디오가 포함되어 있으며 고성능 음성 인식 기술이 바카라 사이트 되더라도 잘못된 인식은 항상 어딘가에 발생합니다 따라서 바카라 사이트자가 바카라 사이트자를 선택하여 이러한 잘못된 인식을 쉽게 수정할 수있는 새로운 인터페이스를 개발했습니다Podcastle이 경우, 음성 인식 중 최종 인식 결과 외에도 발견 될 가능성이 높은 여러 후보자도 발견되며 그림 2의 왼쪽의 예제 화면에 표시된대로 제시됩니다 바카라 사이트자는 올바른 후보자를 선택하여 수정할 수 있습니다 (후보자로 나열되지 않으면 입력 할 수 있음) 이것은 올바른 인덱싱으로 검색 성능을 향상시킵니다 또한 많은 바카라 사이트자의 수정 결과를 배우면 수정이 많을수록 사운드 검색 및 인식의 성능이 향상됩니다

|
|
 |
그림 1 : 팟 캐스트의 전체 텍스트 검색 화면의 예 왼쪽 상단 페이지에 키워드를 입력하면 오른쪽에 표시된 것과 유사한 검색 결과 화면이 표시됩니다
|

|
|
 |
그림 2 : 바카라 사이트자가 음성 인식 오류를 쉽게 수정할 수있는 인터페이스의 예 |
전체 텍스트 검색 결과에서 관심있는 팟 캐스트를 선택하면 왼쪽의 화면에서 검색 된 키워드 주변의 음성 인식 결과를 볼 수 있습니다 가장 가능성이 높은 후보자는 각 섹션의 상단이 인식 결과이며 상단이 아래에 정렬되어 있으며 적절한 후보를 선택하여 간단히 수정할 수 있다는 것입니다 오른쪽의 다이어그램에 표시된대로 전체 텍스트 디스플레이로 전환 할 수도 있습니다 (음성 인식의 신뢰성이 좋지 않은 간격은 빨간색으로 채색됩니다) |
이 연구에서 개발 된 음성 인식 시스템은 새로운 단어에 저항하고 매일 성장하며 업계와 협력하여 실질적으로 바카라 사이트되며 웹 서비스, 로봇, 콜센터 및 회의록 준비와 같은 다양한 응용 프로그램에 배치 될 것입니다 또한이 연구 자체에서 제안 된 개념은 "바카라 사이트자의 오류 수정을 바카라 사이트하여 성능을 향상시키는 패턴 인식 기술"이므로 학문적으로 새로운 것이므로, 우리는 음성 인식 및 기타 분야의 분야 에서이 개념의 효과를 확인하는 것을 고려하고 있습니다