top of page

이제 가전이 내 말을 알아 듣는다!

음성으로 조종하는 스마트 가전의 비밀 기술 대 공개 (With 감바랩스)


자려고 누웠으나, 에어컨이 너무 추워서 리모컨을 찾지만 찾지 못해 불편한 사람.
자려고 누웠으나, 에어컨이 너무 추워서 리모컨을 찾지만 찾지 못해 불편한 사람.

잠들기 전, 에어컨 온도를 바꾸고 싶은데 리모컨이 멀리 있거나, TV를 끄려는데 리모컨이 보이지 않아 불편했던 경험 다들 있으시죠? 이럴 때마다 ‘그냥 말로 제어할 수 있으면 얼마나 좋을까?’라는 생각을 하게 되죠. 이 단순한 바람을 기술로 구현하는 세상이 머지 않았습니다.


내 디바이스와 대화하기! On-device AI

온디바이스 AI는 기존의 클라우드 기반 AI처럼 모든 연산을 서버로 보내지 않고, 디바이스 내부에서 AI 모델이 직접 연산을 수행하도록 설계된 기술입니다. 디바이스 자체가 스마트해 짐은 물론, 클라우드를 경유 할 필요가 없기 대문에 지연도 없고, 안전하고, 오프라인 환경에서도 문제없이 작동 되기 때문에 미래 스마트 라이프를 위한 가전의 핵심 기술로 부상하고 있습니다.  


온디바이스 AI의 3가지 장점
온디바이스 AI의 3가지 장점

특히 운영체제(OS)가 없는 MCU(Microcontroller Unit) 환경에서도 동작 가능한 모델은하드웨어 제약이 심한 소형 디바이스에서도 AI를 구현할 수 있다는 점에서 기술적으로 매우 중요합니다.(AI모델을 돌리기 위해 모든 가전을 컴퓨터 수준으로 만들 필요가 없으니까요)  다양한 아키텍처와 최신 AI 모델을 고객 칩에 맞게 적용해야 하기 때문에 허들이 높지만, 이 부분만 해결 한다면, 작은 디바이스도 AI를 통해 똑똑해 지는 ‘AI for Things’를 구현할 수 있는 것이죠. 이 난이도 높은 영역을 구현한 스타트업이 바로 슈퍼스타트 인큐베이터 3기 감바랩스입니다.

   

 

⚙️ 감바랩스의 초경량 음성 인식 AI 모델


감바랩스는 임베디드 시스템, 음성화자 인식, 프로세서 설계 등 AI 하드웨어 전반의 전문 인력으로 구성된 기술 기반 스타트업입니다. 이미 누가, 무엇을 말하는지 찰떡같이 알아듣는 음성인식 기술로 온디바이스 AI 분야에서 주목받고 있는 스타트업인데요, 이미 구글 스피치에서도 인정하는 최고 수준의 음성인식 성능이라고 해요.


스타트업과 미래 혁신 영역을 조망하고 LG의 기술 커버리지를 확장하는 슈퍼스타트 PoC. 이번에는 감바랩스의 음성 인식 기술과 전세계 가전을 이끌고 있는 LG가 함께 우리 모두의 더 편리한 일상을 만들기 위해, 새로운 도전을 했습니다.



✨소음 환경에서도 정확하고 신뢰성 높은 명령어 인식 시스템을 실현하라!✨

감바랩스의 온디바이스 AI 모델을 LG 전자 온디바이스 AI 전용 칩에 적용 하는 모습을 표현하는 모식도
감바랩스의 온디바이스 AI 모델을 LG 전자 온디바이스 AI 전용 칩에 적용 하는 모습을 표현하는 모식도

티비, 싱크대 물소리, 음악 등 다양한 생활 소음 속에서도 필요할 때 기동어로 가전을 깨우고, 명령을 수행할 수 있게 하는 것이 음성 인식 기반 스마트 가전의 핵심입니다. 더 정확한 검증과, 검증 이후 빠른 적용을 위해, LG전자 가전에 실제로 적용 되는 온디바이스 AI 칩 DQ-1, DQ-C 칩을 직접 활용했어요. 여기에 Noise Injection과 Negative Learning이라는 기술이 적용 된 감바랩스의 초경량 AI모델을 적용, 테스트 했습니다.


  • Noise Injection

    : 실제 환경에 가까운 다양한 노이즈 데이터를 생성하여 모델 학습에 반영.

    수백만 건의 증강 음성 샘플을 통해 소음 상황에서도 인식 정확도 유지.

  • Negative Learning

    : 잘못된 인식을 학습 과정에서 점진적으로 감소시키는 반(反)학습 구조.

    오인식률을 효과적으로 줄이며 모델의 안정성을 강화.



🔬 PoC 결과 — 성능으로 검증된 가능성

감바랩스의 초경량 음성인식 온디바이스 AI 모델을 적용 해 본 결과, 모두 목표를 초과 달성 했음이 확인 되었음
감바랩스의 초경량 음성인식 온디바이스 AI 모델을 적용 해 본 결과, 모두 목표를 초과 달성 했음이 확인 되었음

테스트 1. 소음 환경 인식률 평가싱크대 물소리, TV, 청소기, 음악 등 실제 가정 환경을 시뮬레이션하여 기동어 인식률을 측정했습니다. 목표 대비 초과 달성. 소음이 많은 조건에서도 안정적인 반응을 보였습니다.


테스트 2. 오인식(잘못된 반응) 평가48시간 동안 드라마 음원을 연속 재생하며 오작동 횟수를 측정했을 때, 결과: 48시간 동안 오류 발생 0회. 이는 모델의 정합성과 민감도 제어 기술이 실제 환경에서도 가능성이 충분히 검증되었음을 의미합니다.


💡가볍지만 확실한 음성 인식의 비밀은?!

가장 가볍게, 하지만 정확하게 인식하는 AI 모델

음성 인식 기술에서 중요한 것은 정확하게 들어야 할 단어만 듣는 것입니다.즉, 다양한 음성 속에서 필요한 기동어를 선별하고, 명령어를 자연스럽게 해석해야 합니다. 그리고 문제는 이 모든 과정을 초거대 언어 모델(LLM) 이 아닌, 리소스가 한정된 온디바이스 환경에서 수행해야 한다는 점입니다.


감바랩스의 프레임별 음성 인식 기술
감바랩스의 프레임별 음성 인식 기술

감바랩스는 이 문제를 해결하기 위해 다음과 같은 구조를 채택했습니다.


  • 2초 길이의 짧은 음성을 5프레임 단위로 이동 분석

  • 각 프레임의 인식 결과를 누적 비교하여 5회 이상, 유사도 95% 이상 일치할 때만 ‘인식’으로 확정

  • 민감도 조절을 통해 인식 효율 최적화

    • 기동어(Wakeup) : 민감도를 낮춰 오인식 최소화

    • 명령어(Command) : 민감도를 높여 자연스러운 발음도 인식 가능


이 접근 방식은 단순히 모델을 “가볍게” 만든 것이 아니라, 한정된 하드웨어 리소스 내에서 정확도와 사용성을 모두 확보한 구조적 최적화라고 할 수 있고, 이번 PoC를 통해 그 가능성이 검증 된 것이죠!




정확한 음성 인식은 단순히 디바이스를 켜고 끄고 조작 하는 키워드 인식 외에 무궁무진한 가능성을 갖고 있습니다. 먼저, 온디바이스 환경에서 자연어처리를 가능하게 합니다. 그렇다면 모든 가전이 나와 대화할 수 있는 스마트한 가전 환경이 펼쳐지는 것이죠. 거기에 화자 인식 기술까지 더해지면 Security는 확보 되면서 초개인화 서비스도 가능한 세상이 열리게 되는 것입니다 앞으로는 사용자별 음성 패턴과 맥락을 인식하는지능형, 개인화된 가전 경험도 충분히 가능한 것이죠. 우리 모두의 더 나은 삶을 위한 기술을 슈퍼스타트가 응원합니다.


🎬감바랩스 PoC 미니 다큐 보러가기 Click

bottom of page