키보드? 얼마나 기이 한

음성 검색 및 음성 작동 소프트웨어의 시대가 다가 왔습니다. 개발자로서 저는 키보드 옆에 살고 죽지 만 이미 징후를 볼 수 있습니다. 예를 들어 많은 사람들과 마찬가지로 Android 휴대 전화와 대화합니다 (예 : "Navigate to Lowes [또는 Starbucks 또는 Harris Teeter]"). 길 찾기.

Mary Meeker의 2016 년 인터넷 트렌드 보고서에서 그녀는 Google 보이스 검색 쿼리가 2010 년 이후 7 배 증가했다고보고합니다. 또한 12 살 된 제 아들이 거의 모든 검색을 음성으로 수행한다는 사실을 알게되었습니다. 여자 친구가 정기적으로 이런 식으로 문자를 보냅니다. 또한 제가 근무하는 회사 인 Lucidworks는 최근 IBM과의 새로운 파트너십을 발표하여 Watson 및 텍스트 음성 변환 기능을 엔터프라이즈 검색 제품에 통합했습니다. 

이 기술은 예전보다 훨씬 더 잘 작동하며 응용 프로그램에 통합하기가 더 쉽습니다. Android 또는 iOS 용으로 개발하는 경우 음성 인식을위한 API에 쉽게 연결할 수 있습니다. 그러나 음성 인식은 간단한 음성-텍스트 및 음성 명령으로 시작하고 끝나지 않습니다.

검색의 의도를 이해하는 것은 특히 구어에서 매우 상황에 맞는 작업입니다. 더욱이, 사람들은 검색 창을 접할 때보 다 자연어로 더 많은 단어를 사용하는 경향이 있습니다. 일반 텍스트 검색보다 구어에서 더 많은 "노이즈 단어"가 있습니다.

이는 중요한 AI 과제입니다. 하지만 컨텍스트 문제를 극복하면서 개발자는 텍스트보다 음성으로 더 많은 일을 할 수 있다는 것을 알게 될 것입니다. 정서적 맥락이 중요한 역할을합니다. 주유소를 찾고 있다면 가장 저렴한 주유소 또는 가장 가까운 주유소를 원하십니까? 당신의 목소리의 감정적 인 내용은 그것을 암시 할 수 있습니다. 물론, 명확히 할 수는 있지만 그럴 필요는 없습니다.

수다스러운 미래

음성 기반 시대는 검색에만 국한되지 않습니다. 그것은 우리가 컴퓨터와 상호 작용하는 모든 방식에 영향을 미칠 것입니다. 머지 않은 미래에, Scotty는 "Star Trek IV"에서 유명한대로 키보드를 "기이 한"것으로 간주 할 것입니다.

그러나 이러한 변화에는 완전히 새로운 UI도 필요합니다. 제가 의미하는 바에 대한 고대 예시가 있습니다. Windows 95가 출시되었을 때 IBM은 음성 명령을 PC에 통합했습니다. 당시 저는 Office Depot에서 영업 사원으로 일하고 있었는데 음성 명령이 얼마나 비현실적인지 금방 분명해졌습니다. 창 인터페이스는 이러한 형태의 상호 작용에 전혀 적합하지 않았습니다.

내 말은, 어떻게 다른 창에서 창을 이동시키고 음성 명령을 사용하여 효율적으로 화면에 맞도록 창 크기를 조정합니까? 당신은하지 않습니다. 당신은 그 창 (그리고 아마도 Windows)을 모두 버립니다. 음성 기반 UI는 동일한 모티프를 사용하지 않습니다. "Star Trek"에서 창 인터페이스를 볼 수 없습니다.

사람들이 코딩을 시작하거나 기술적 인 작업을 시작하면 항상 촉각 인터페이스로 전환합니다 (정확히 촉감이 아니라 회로 기판의 아르누보 렌더링이 겹쳐진 마이크로파 키보드처럼 보입니다). 그러나 "타이핑"에 대한 회귀가 필요합니까? 사실, Scala에서 코딩하기 위해 음성 인터페이스를 사용하는 것은 상상할 수 없습니다. 아마도 새로운 언어 (Scala와 저의 기사와는 달리 괄호가 없음)가 특별히 음성에 적합한 언어로 개발 될 것입니다.

웹 사이트는 분명히 똑같지 않을 것이며 새로운 탐색 패러다임을 제공 할 것입니다. "신발 할인을 보여 줘"라고 말하면 일반 웹 사이트 ( "거래"&& "신발")보다 더 잘 정리되고 상황에 따라 더 민감한 정보를 얻을 수 있습니다. 또한 스크롤하거나 "다음 페이지"라고 많이 말하고 싶지 않기 때문에 상호 작용을 개인화해야합니다. 시스템은 내가 남성용 신발을 원하고 아킬레스 건염 때문에 딱딱한 신발을 원하지 않는다는 것을 이미 알고 있어야합니다. 내가 짙은 색을 선호한다는 걸 알지도 모르죠. 내가 말했거나 내 행동을 분석했을 수도 있습니다.

이것은 웹 사이트입니까? 물론, 제가 신발 쇼핑을하고 있다면 시각적으로 표현하고 싶겠지 만, 제가 말하고 있다면 기계가 대답을하고있을 수도 있습니다. 신발을 보여 주면 "특정 신발을 찾고 있습니까?이 신발은 어떤 용도로 사용됩니까? 하이킹이나 파티에 신었습니까?"라고 묻습니다.

음성 검색의 시대는 우리가 기계와 상호 작용하는 방식에서 코딩 방식에 이르기까지 모든 것을 바꿀 것입니다. 우리가 필요로하는 많은 기술은 이미 현재 우리에게 제공되고 있지만 다른 기술은 아직 개발되지 않았습니다. 사용자 인터페이스에 미치는 영향은 펀치 카드에서 키보드로 전환하는 것보다 더 클 수 있습니다.

이 대대적 인 변화는 한 번에 오지 않을 것입니다. 오늘은 키보드를 버리는 날이 아닙니다. 그러나 웹 사이트를 진정한 음성 액세스가 가능하도록 재 설계하는 것에 대해 생각하기 시작할 날이 될 수 있습니다.