게시 및 게시 날짜 : 2008/10/14

실시간 바카라 사이트에서 비디오 및 오디오 데이터에서 실시간 바카라 사이트록 콘텐츠를 자동으로 생성하는 시스템

-누가 어떤 진술을했는지, 어떤 진술을했는지 검색하고보기에

포인트

  • 소규모 실시간 바카라 사이트에서 어떤 키워드, 언제 어떤 키워드를 말했는지 알 수있는 시스템을 개발하고 멀티미디어 실시간 바카라 사이트록 콘텐츠를 만들고
  • 제목이되고 확대되는 키워드를 사용하여 장면을 검색하는 기능을 통해 스피커를 단기간에 실시간 바카라 사이트 개요를 이해할 수 있습니다
  • 비용 효율성 문제로 인해 준비되지 않은 소규모 실시간 바카라 사이트의 검색,보기 및 분석

요약

정보 기술 연구 부서 [Yoshikawa Hiroyuki, Hiroyuki hiroyuki] (이하 "실시간 바카라 사이트"라고 언급 됨) (국립 고급 산업 과학 및 기술 연구소 (이하 "실시간 바카라 사이트") 소장 인 Asano Tai 연구원은 "실시간 바카라 사이트"( "실시간 바카라 사이트"라고 언급 됨)는 "Marc"를 결정하고 인식하는 시스템을 자동으로 결정하고 인식하는 시스템을 개발하고 인식하는 시스템을 자동으로 결정하고 인식하는 시스템을 발전 시켰습니다 전용 카메라와 마이크를 사용하여 오디오를 녹음했습니다

이 시스템은 전용 입력 장치를 사용하여 실시간 바카라 사이트의 내용을 포함하는 멀티미디어 데이터 (비디오/오디오)에서 언제 어떤 진술을했는지 및 어떤 종류의 의견을 작성했는지에 대한 정보를 제공합니다마이크 배열사운드 소스를 현지화하려면음원 분리|를 사용하여 자동으로 추정하여 실시간 바카라 사이트의 구조를 시각화 할 수 있습니다 음성 인식 기술 예를 들어, 키워드가 포함 된 장면을 쉽게 검색하고 재생하거나 재생 중에 스피커를 자동으로 확대하는 등 사용자에게 스트레스가 적은 실시간 바카라 사이트록을 볼 수 있으며, 사용자는 단기간에 실시간 바카라 사이트 개요를 이해할 수 있습니다 이 시스템을 사용하면 마케팅에 사용 된 그룹 인터뷰와 같은 고객과의 실시간 바카라 사이트를 포함하는 방대한 양의 데이터에서 원하는 정보를 쉽고 빠르게 검색 할 수 있습니다

이 결과는 실시간 바카라 사이트 Open Lab에서 공개 될 예정이며, 2008 년 10 월 20 일부터 21 일까지 실시간 바카라 사이트 Tsukuba Center에서 개최 될 예정입니다

"marc"사진, 멀티미디어 회의록 콘텐츠를 자동으로 생성하는 시스템


개발의 사회적 배경

의회와 같은 대규모 실시간 바카라 사이트에서 전문 비서관은 종종 나중에 볼 준비를합니다 반면에, 소규모 실시간 바카라 사이트에서도 절차의 내용을 어떤 식 으로든 나중에 볼 필요가 있습니다 예를 들어, 마케팅 연구에 사용 된 그룹 인터뷰에서 실시간 바카라 사이트 내용은 나중에 자세히 분석되며 시장 동향은 실시간 바카라 사이트 내용에서 이해됩니다 또한 금융 및 보험 부문의 고객 답변 기록을 유지해야합니다 그러나 소규모 실시간 바카라 사이트에서 수동 분 준비는 일반적으로 비용 효율성의 관점에서 비디오 카메라 나 레코더를 사용하여 실시간 바카라 사이트 내용을 기록하는 데 사용됩니다 카메라 나 레코더를 사용한 녹음은 간단한 방법이지만 녹음 된 내용에는 누가 언제, 언제, 어떤 종류의 진술을했는지에 대한 정보가 포함됩니다 (태그 정보)가 없으므로 나중에 실시간 바카라 사이트의 내용을 이해하기 위해서는 녹음 된 비디오 테이프 및 기타 컨텐츠를 처음부터 끝까지 재생해야합니다 이는 비효율적입니다

연구 이력

이러한 상황으로 인해 최근 몇 년 동안 실시간 바카라 사이트 분에 대한 연구가 적극적으로 수행되었지만, 주로 기본 연구 단계에있는 시스템의 예는 거의 없으며 데이터 기록에서 자동으로 실시간 바카라 사이트록 콘텐츠의 자동 생성에 이르기까지 애플리케이션을 지속적으로 개발하고 있습니다 실시간 바카라 사이트록 콘텐츠를 자동으로 생성하기 위해 다음 과제를 인용 할 수 있습니다

과제 1 : 번거 로움과 관련이없는 실시간 바카라 사이트 기록, 각 스피커에 마이크를 착용하는 것과 같은 작업
과제 2 : 키워드 등을 사용하여 댓글을 쉽게 검색합니다
과제 3 : 이해하기 쉬운 방식으로 실시간 바카라 사이트 개요 시각화

실시간 바카라 사이트는 신호 처리, 음성 인식 및 이미지 처리와 같은 원소 기술을 연구하고 있습니다 위에서 언급 한 과제를 극복하기 위해 이러한 기술을 통합하고 멀티미디어 컨퍼런스 분 콘텐츠를 자동으로 생성하는 실용적인 시스템을 개발하기 위해 노력해 왔습니다

또한,이 연구의 일부는 과학 연구 (18200007)의 보조금에 의해 부여되었습니다

연구 컨텐츠

우리는 전용 입력 장치를 사용하여 소그룹 실시간 바카라 사이트를 녹음하여 멀티미디어 실시간 바카라 사이트록 콘텐츠를 자동으로 생성하는 시스템 인 "Marc"를 개발했습니다 이 시스템은 마이크 배열과 전 방향 카메라로 구성된 입력 장치 (그림 1), 음원 로컬 로이션, 음원 분리, 음성 인식 기술 및 기타 기능을 수행하는 소프트웨어 및 멀티미디어 컨퍼런스보고 컨텐츠를보기위한 브라우저로 구성됩니다

마이크 배열 및 전 방향 카메라로 구성된 입력 장치 사진

그림 1 : 마이크 배열과 전 방향 카메라로 구성된 입력 장치

 말하기 이벤트(장면) 정보 (언제 진술을했는지)는 마이크 배열, 사운드 소스 현지화, 사운드 소스 분리 및 음성 인식 기술을 사용하여 자동으로 추정되어 실시간 바카라 사이트 구조를 시각화합니다 이 시스템을 사용하면 키워드가 포함 된 발화 이벤트를 검색하고 재생하거나 재생 중에 스피커를 자동으로 축소하는 등 사용자에게 스트레스가 적은 실시간 바카라 사이트록을 볼 수 있습니다

그림 2는 콘텐츠 생성으로 이어지는 프로세스를 보여줍니다

콘텐츠 생성으로 이어지는 흐름의 그림

그림 2 : 콘텐츠 생성 프로세스

먼저, 8 개의 음향 신호 채널이 마이크 배열을 사용하여 기록되고, 매번 사운드 소스의 방향은 사운드 소스 위치에 따라 추정됩니다 이 방향 정보는 각 스피커 (클러스터링)에 대해 요약되며 음성 이벤트 정보로 감지하여 어떤 스피커가 말하는지 자동으로 결정합니다 다음으로 사운드 소스를 분리하여 불필요한 겹치는 소리가 제거됩니다 실제 실시간 바카라 사이트에서 다른 참석자의 잔향과 방의 잔향은 음성 인식의 대상이되는 연설과 겹치므로, 화자와 마이크 사이의 거리가 멀리 떨어져 있으면 신호 대 노즈 비율 (S/N 비율)이 감소하고 음성 인식의 정확성이 크게 줄어 듭니다 따라서 각 스피커에 마이크를 착용하지 않고 음성의 내용을 자동으로 인식하려면 음원을 분리하는 기술이 필수적입니다 사운드 소스 위치에서 음원 분리에 이르기까지 일련의 음향 신호 처리를 통해 각 스피커가 마이크를 착용 할 필요없이 테이블 중간에 그림 1에 표시된 것과 같은 기록 장치를 배치하여 스피커를 간단하게 식별 할 수 있습니다 (문제 1)

11750_11829구조화그렇게함으로써 실시간 바카라 사이트 중에 의견을 검색 할 수 있습니다 (인증 2)

각 음성 이벤트를 검색하기위한 태그 정보를 추가하여 회의 내용을 구성하는 다이어그램

그림 3 : 각 음성 이벤트 검색 (장면)을 검색하기위한 태그 정보 추가 실시간 바카라 사이트 내용을 구성

반면, 만능 카메라로 녹음 된 파노라마 이미지는 스피커 이벤트에 대한 태그 정보를 기반으로 스피커를 항상 확대합니다

또한 생성 된 멀티미디어 실시간 바카라 사이트록 콘텐츠를 효과적으로 볼 수있는 브라우저를 개발했습니다 이 브라우저를 사용하면 화면 오른쪽에 자주 사용되는 키워드를 대량으로 표시하고 원하는 키워드를 클릭하여 이러한 키워드가 실시간 바카라 사이트에 어떻게 배포되는지 시각화 할 수 있습니다 이 이미지 처리 및 브라우저는 실시간 바카라 사이트 개요를 시각화하는 데 효과적입니다 (Challenge 3)

회의 회의록 브라우저 Marcbrowser 화면

그림 4 : 실시간 바카라 사이트록 브라우저Marcbrowser스크린

비디오 : 1 분 24 초】(Windows Media형식)

미래 계획

우리는 이번에 개발 된 프로토 타입 시스템을 사용하여 실제 실시간 바카라 사이트를위한 데모 실험을 수행 할 계획입니다 시연 실험의 결과를 고려하여 회사는 반복 된 개선 후 기술 및 기타 수단을 전송하여 실제 응용 프로그램을 구현하는 것을 목표로합니다

또한 실시간 바카라 사이트가 개발 한 "사용자가 협력 할 때 성능을 향상시키는 음성 정보 검색 시스템"(Podcastle) (발표가 발표되어 2008 년 6 월 12 일), "음성에 의한 멀티미디어 검색 시스템"(2008 년 10 월 8 일 발표)에 사용 된 원소 기술과 결합함으로써 음성 인식 및 음성 검색의 정확도가 향상 될 것으로 예상됩니다 우리는 앞으로 이러한 기술과 퓨전에 대한 연구를 계속할 계획입니다


터미널 설명

◆ 마이크 배열
다중 마이크의 공간 배열 단계적 배열 안테나와 동일한 원리를 기반으로, 사운드에 도달하는 시간은 사운드 도착 방향에 따라 다르므로 사운드 소스의 방향을 추정하고 여러 사운드 소스를 분리 할 수 ​​있습니다[참조로 돌아 가기]
◆ 음원 분리
여러 사운드 소스에서 사운드를 분리하고 여러 마이크의 사운드 신호에 신호 처리를 적용하여 겹치는 노이즈를 제거하는 기술 이 프레젠테이션은 Adaptive Beamforming이라는 기술을 사용하여 별도의 사운드 소스를 사용합니다[참조로 돌아 가기]
◆ 태그 정보
태그는 소포 태그 등을 의미합니다 속성 (예 : 제품의 가격, 원산지)과 같은 정보를 특정 항목에 추가 할 때 사용됩니다[참조로 돌아 가기]
◆ 말하기 이벤트
사람이 실시간 바카라 사이트에서 시작하고 끝나는 시간부터 "말하기 이벤트"정의[참조로 돌아 가기]
◆ 구조화
예를 들어, CD를 재생할 때는 노래 제목 및 녹음 시간과 같은 정보가 디스플레이에 표시되므로 사용자는 원하는 노래 만 선택하고 재생할 수 있습니다 음악 데이터가 "구조화 되었기 때문"이기 때문입니다 실시간 바카라 사이트의 내용이 단순히 비디오 또는 이와 유사한 것으로 기록되면 기록 된 데이터는 구조화되지 않습니다 기록 된 데이터를 구성하고 언제 진술을했는지에 대한 정보를 추가함으로써 실시간 바카라 사이트 내용을 쉽게 검색하고 원하는 데이터 만 재생할 수 있습니다[참조로 돌아 가기]

관련 기사


문의

연락처 양식