과학 기술

가장 일반적인 음성 인식 문제는 무엇입니까?

음성 인식 소프트웨어는 처음 발명 된 이후로 크게 발전했지만 여전히 전사 방법으로 독점적으로 사용되는 것을 방지하는 몇 가지 큰 문제가 있습니다.해결하기 어려운 음성 인식 문제 중 일부는 단어, 개별 악센트, 동성애 및 원치 않는 주변 소음의 발음의 변화를 포함합니다.다른 음성 인식 문제는 소프트웨어가 음성을 해석하는 방법에 큰 영향을 줄 수 있기 때문에 실제로 사운드를 입력하는 데 사용되는 하드웨어 유형과 관련이 있습니다.또한 말하는 단어의 맥락을 알지 못하는 문제가 있으며, 이는 문장 부호 또는 부정확 한 철자가없는 텍스트로 이어질 수 있습니다.

가장 기본적인 음성 인식 문제 중 하나는 사용되는 입력 장치의 품질입니다.마이크가 충분히 민감하지 않은 경우 mdash;또는 지나치게 민감하고 mdash;그런 다음 소프트웨어가 해독하기 어려운 오디오 정보를 만들 수 있습니다.이것은 마이크가 너무 민감하여 음성이 왜곡되어 인식 소프트웨어를 거의 쓸모 없게 만듭니다.비슷한 문제는 주요 연설에서 분리하는 데 문제가 될 수있는 배경 소음에서 비롯되며 음성 처리에 포함될 때 부정확 한 번역을 유발할 수 있습니다.문제.한 단어가 여러 가지 방법으로 발음 될 수 있으면 소프트웨어가 혼란스러워지고 말하는 것을 잘못 해석 할 수 있습니다.사람이 프로그램이 예상하는 것보다 느리거나 빠르게 말하면 동일하게 발생할 수 있습니다.단일 사용자의 음성 패턴에서 소프트웨어를 훈련하고 동적 시간 경고 알고리즘을 사용하여 음성을 샘플 데이터베이스에 맞추는 것과 같은 부분 솔루션이 있지만 모든 문제를 해결하지는 않습니다.음성 인식 문제는 말하는 단어의 맥락을 식별하는 것입니다.컴퓨터 소프트웨어는 단어 모음의 의도 된 의미를 식별 할 수 없으며 전사 된 텍스트에 많은 문제가 발생합니다.비슷한 소리가있는 단어와 같은 단어는 사용의 컨텍스트가 알려져있을 때만 정확하게 철자를 낼 수 있습니다.이와 같은 이유로, 단어 순서를 아는 것만으로는 소프트웨어가 배치하는 것이 정확한 구두점이 거의 불가능합니다.의약품과 같은 분야에서 사용되는 기능적 전사 소프트웨어가 있지만 결과는 종종 어떤 유형의 분리가없는 단어 블록이므로, 이는 여전히 인간의 전사가 문서를 편집하고 읽을 수있는 최종 사본을 작성하는 데 여전히 필요합니다.