VC, 창업가 위한 글로벌 음성 AI SaaS ‘티로’의 임은성 대표

많은 AI 음성 인식 서비스가 대중을 좇는 와중에 비즈니스 실사용자에 집중한다는 전략으로 주목받는 서비스가 있다. 실시간 음성 기록 및 요약 서비스 ‘티로(Tiro)’다. 티로는 VC, 스타트업 대표, 임원진 등 고밀도 미팅 환경에 놓인 사용자를 타기팅해 빠르게 성장 중이다. 서비스 출시 8개월 만에 누적 가입자 4만명을 돌파했고, 미국, 일본 등 해외 확장에도 속도를 내고 있다.

공동 창업진도 눈길을 끈다. 물류, 헬스케어 등 여러 산업에서 제품을 개발해 온 임은성 대표를 비롯해 스타트업 엑시트 후 VC로 활동한 홍유나 이사, 에듀테크 플랫폼 ‘콴다’에서 프론트엔드 리드를 맡았던 김상철 이사가 함께한다.

더플레이토는 지난 3월, 스마일게이트인베스트먼트와 매쉬업벤처스로부터 총 8억 원 규모의 시드 투자를 유치했다. 투자를 리드한 스마일게이트인베스트먼트 관계자는 “창업 초기부터 글로벌 AI SaaS를 지향한 팀으로, LLM 이후 주목받는 음성 AI 분야에서 빠른 성장을 보여주고 있다”고 평가했다.

서울 강남 오렌지플래닛에서 만난 임은성 대표는 “티로가 사람의 기억력과 청각의 한계를 확장하는 ‘세컨드 브레인’이 되겠다”라고 포부를 밝혔다.

더플레이토 임은성 대표
더플레이토 임은성 대표 (출처=더프론티어)

비즈니스 미팅을 원활하게 하는 ‘AI 비서’

Q. 티로는 어떤 서비스인가요?

티로는 삶이 곧 중요한 대화의 연속인 분들을 위한 AI 비서입니다. 사용자가 중요한 미팅, 인터뷰, 1:1 대화 상황에서 대화 자체와 상대에만 집중할 수 있도록 대화 내용을 실시간으로 기록하고 번역하고 요약해 줍니다.

Q. 티로의 실제 사용 사례를 소개해 주시겠습니까?

먼저 기본적인 사용 방식을 말씀드리자면, 사용자가 말하는 내용을 실시간으로 받아 적고 필요시 번역도 함께 진행합니다. 단순히 속기하듯 텍스트를 나열하는 것이 아니라, 문단 단위로 내용을 구조화해 요약합니다. 사람이 직접 정리하듯이, 맥락을 이해한 요약본이 만들어지는 셈입니다. 회의가 끝난 후에는 전체 내용을 자동으로 요약한 커스텀 문서 형태로 정리할 수 있어 공유도 간편합니다.

현재 고객의 약 95%가 비즈니스 목적 사용자입니다. 특히 VC, 스타트업 대표, 임원진처럼 하루에도 세세하게 일정이 짜여 있고, 중요한 회의가 연속되는 분들이 주로 활용하고 계십니다.

VC의 하루를 생각해 보면, 아침 주간 회의부터 점심 커피챗, 오후 IR 미팅까지 회의 일정이 촘촘합니다. IR 미팅에서는 바이오나 딥테크 등 익숙하지 않은 산업의 용어가 오갈 수 있죠. 실시간으로 모두 따라가기 쉽지 않습니다. 이 때 티로를 켜 두면 놓친 내용을 바로 확인할 수 있고, 복잡한 용어도 정리되어 있어 대화의 흐름을 유지할 수 있습니다.

Q. 비즈니스 외적으로도 사용 사례가 있을까요?

네, 티로는 특정 산업에 국한된 버티컬 SaaS가 아니라, 사용자의 삶 전반에서 활용될 수 있는 도구입니다. 한 미국 사용자는 집에서 아내와의 ‘원 온 원 미팅’, 즉 일종의 중요 가정사 결정과 관계 회고 시간에 티로를 활용한다고 했습니다. 대화에만 집중하고, 기록은 티로가 맡는 거죠. 이후 히스토리를 되짚으며 더 나은 관계를 쌓는 데 도움을 받고 있다고 하더라고요.

지난 주에 인터뷰한 다른 사용자분은 청각적으로 어려움이 있는 분이셨는데, 회의 내용을 실시간으로 따라갈 수 있게 되면서 회의 중간에 직접 질문도 할 수 있게 되었다고 말씀하셨습니다. 이 분은 곧바로 비즈니스 무제한 플랜으로 전환하셨죠. 저희에게 굉장히 의미 있는 순간이었습니다.

(제공=더플레이토)
Q. 최근 모바일 앱을 정식 출시하셨는데요. 어떤 기능과 사용자 환경에 중점을 두셨습니까?

같은 서비스라도 어떤 기기(폼팩터)에서 사용하는지에 따라 사용자가 기대하는 요소가 달라집니다.

모바일은 기본적으로 노트북보다 기능 제약이 있고, 사용자는 ‘지금 이 상황에서는 모바일로 기록할 수밖에 없다’는 맥락에 있습니다. 그래서 실시간 상호작용보단 기록 안정성과 공유 편의성, 즉 후처리 기능이 중요합니다. 또한, 모바일 앱은 한 페이지 안에 버튼이 많거나 클릭이 어려우면 어려움을 겪기 마련입니다.

그래서 최대한 단순하고 직관적인 UX 구현에 집중했습니다. 앱을 켜면 바로 녹음 가능하고, 종료 후 클릭 한 번으로 요약본을 내려받을 수 있습니다. 버튼도 엄지의 범위 안에 두려고 많이 노력을 했습니다.

다른 차이점은 오프라인 사용성입니다. 노트북 환경은 대부분 네트워크가 안정적이지만, 모바일에선 인터넷 연결 없이 사용하는 경우도 있습니다. 중동 등 일부 지역은 모바일로 회의하는 도중에 인터넷이 끊기는 일이 종종 있고요. 이런 점을 고려해, 오프라인 상태에서도 잘 작동할 수 있도록 하는 부분을 중점적으로 개선하고 있습니다.

Q. 다양한 음성 인식 기반 서비스 중 티로를 선택해야 하는 차별화된 경쟁력은 무엇입니까?

크게 세 가지로 요약할 수 있습니다.

첫째, 실시간 기록과 상호작용입니다. 사용자가 말하는 내용을 즉시 받아적고, 요약본을 볼 수 있죠. 특히 멀티태스킹으로 집중하기 어려운 상황에서 실시간상호작용 기능은 큰 도움이 됩니다.

둘째, 사용자 맥락을 반영한 고정밀 기록입니다. 사용자의 직무나 대화 주제를 이해해 점점 더 정교한 노트를 제공합니다. 전문 용어, 고유명사 등 체감 정확도가 중요한 요소에서 강점을 보이며, 쓸수록 나에게 맞춰지는 ‘세컨드 브레인’처럼 작동합니다.

셋째, 모든 대화 상황과 기기를 아우르는 통합성입니다. 회의, 강의, 인터뷰, 1:1 대화 등 다양한 상황에서 사용할 수 있고, 웹, 데스크톱(맥, 윈도우), 모바일 앱까지 지원합니다. 개인의 전체 커뮤니케이션을 돕는 범용 AI 비서를 지향한다는 점이 차별화 포인트입니다.

(출처=더플레이토)

전문가 타깃팅, 유료 플랜만 제공하는 프리미엄 제품

Q. 티로는 초기 고객을 어떻게 확보하셨나요? 마케팅 전략이 궁금합니다.

저희가 타깃한 고객층은 토스, 당근마켓 같은 ‘대중적인 B2C’와는 다릅니다. 티로는 강한 페인포인트를 지닌 전문가 소수 층을 겨냥했습니다. 그래서 초기 전략은 빠른 팽창이 아니라 정밀 타기팅과 고객 만족이었습니다.

그래서 페이드 마케팅(유가 광고)은 단 한 번도 진행하지 않았습니다. 전적으로 바이럴 중심 성장 전략을 선택했습니다. VC, 창업가, 특히 솔로프리너를 중심으로 한 분 한 분 지속적으로 연락하며 제품을 알리고, 만족시키고자 노력했습니다. 이분들은 커뮤니티에서 ‘허브’ 역할을 하시는 분들이라서 자연스럽게 주변에 전파해 주셨습니다. 자발적인 확산 효과가 상당했죠.

이러한 제품 주도 성장(Product-led growth)을 추구하다 보니 초기에는 성장 속도가 느렸지만, 어느 시점 이후에는 티핑 포인트를 넘으며 사용자가 폭발적으로 늘기 시작했습니다. 저희 입장에서도 어디서 유입되었는지 파악이 어려울 정도로 빠르게 퍼졌습니다.

Q. 전환율을 높이기 위해서는 어떤 UX 전략을 설계하셨나요?

일반적으로 초기 SaaS 제품은 결제 단계를 전면에 내세우면 전환율이 떨어질 것이라 예상하는데요. 여러 제품 제작에 참여한 경험상 결제 유도 시점을 앞당긴 경우, 결제 전환율이 약 30% 높아집니다.

따라서 저희는 처음부터 ‘결제를 전제로 한 프리미엄 제품’이라는 인식을 분명히 심어주는 전략을 선택했습니다. 무료 플랜 없이 300분으로 제한된 무료 체험만 제공하고, 체험 도중에도 일부 기능은 구독해야만 사용할 수 있도록 했습니다.

초기에는 유료 음성 AI 제품에 대한 인식이 낮고, 단가가 높아 부담될 수 있다는 우려에 고민을 많이 하기도 했습니다. 하지만 무료 이용자보다 ‘진짜 문제를 가진 고객’에게 집중하자는 전략을 택했고, 결과적으로 좋은 선택이었다고 생각합니다.

Q. 사용자 피드백과 행동 데이터는 어떤 방식으로 제품 개선에 반영되고 있나요?

티로는 본질적으로 고관여 제품이다 보니 사용자 피드백이 자발적이고 강도가 높습니다. “이 서비스는 내 삶을 바꿨다”, “꼭 필요한 도구다” 같은 메시지가 이메일, 링크드인 등 여러 채널을 통해 자주 도착합니다. 반대로 작은 문제가 생겨도 곧바로 불만이 전달됩니다. 피드백의 밀도와 처리량이 매우 높습니다.

결제 사용자에게는 무조건 온보딩을 겸한 유저 인터뷰를 요청합니다. 결제로 전환하지 않은 무료 체험 사용자 에게는 그 이유를 확인하기 위해 개별적으로 접촉을 시도하기도 합니다. 글로벌 확장을 준비하면서 특정 언어권 사용자를 대상으로 별도 리서치 프로젝트도 병행하고 있습니다. 데이터 측면에서는 내부 BI 대시보드로 면밀히 지표를 분석하고요.

하지만 단순히 사용자 요구사항 수집에 그치지 않고, 제작자의 직관을 통한 ‘발명’을 더 중시합니다. 사용자는 문제를 직감할 수는 있어도 최적의 해법을 제시하긴 어렵기 때문입니다. 더플레이토는 제품 자원의 약 60%를 발명, 40%를 사용자 발견 기반에 할애해 개선 방향을 조율하고 있습니다.

Q. 음성 인식 및 요약 성능은 어떤 방식으로 측정하고, 지속적으로 개선하고 계신가요?

음성 인식과 요약 기술의 평가는 기존 머신러닝이나 전통적인 알고리즘에 비해 훨씬 복잡합니다. 대형 언어 모델(LLM)이나 음성 기반 모델(Speech model)은 결과가 사용자나 맥락에 따라 다르게 인식되기 때문에, 객관적인 ‘정답’을 정하고 평가하기가 어렵습니다. 그래서 저희는 일반적인 기술 평가 방식 외에도, 휴먼 프리퍼런스(human preference) 기반의 평가 방식을 활용하고 있습니다.

최근에는 평가를 자동화하고자 LLM이 다른 LLM을 평가하게 하는 방식을 도입하고 있습니다. 예를 들어 일본어 요약 기능을 테스트할 때, 과거에는 원어민의 도움을 받았습니다. 요즘은 GPT-4.5에 적절한 프롬프트를 제공해 결과물을 평가하도록 요청합니다. 사람이 분석한 결과보다 더 상세하며, 더 빠르고 저렴합니다.

이런 방식으로 검수 자동화 수준이 점차 높아져 사람이 전체를 검수하지 않아도 되는 수준까지 왔습니다. 지금은 샘플 10개 중 3개만 수동 검수하고, 결과가 일정 수준 이상일 경우 전체 결과를 신뢰하고 있습니다.

임 대표가 티로의 요약 기능을 설명하고 있다.
임 대표가 티로의 요약 기능을 설명하고 있다. (출처=더프론티어)

해외 투자 위한 선택, 미국으로의 플립과 일본 법인 설립

Q. 티로가 주목하고 있는 해외 시장은 어디인가요?

티로는 12개 언어를 지원하고 있습니다. 대부분 사용자 요청을 받아 순차적으로 추가해 왔습니다. 전체 사용자 중 약 90%가 한국어 사용자였지만 최근에는 글로벌 유입이 늘면서 83% 정도로 줄어들었습니다. 영어 사용자가 10% 이상이고, 미국, 캐나다, 호주, 싱가포르 등 다양한 국가에 분포해 있습니다. 최근 진출한 일본에서도 빠르게 사용자층이 늘고 있습니다. 한국에 이어 미국, 일본 순으로 높은 결제 의사를 보이기 때문에, 이 두 시장을 최우선으로 집중하고 있습니다.

Q. 플립에 대한 고민도 하셨다고 들었습니다. 플립을 고민한 배경을 설명해 주세요.

최근 스타트업 생태계에서 해외 자본과 글로벌 시장을 중심으로 더욱 기회가 열리는 추세입니다. 문제는, 해외 투자자들이 한국 법인에 투자하기를 상당히 회피하는 경향이 있다는 점입니다. 저희 역시 해외 투자 유치를 추진하면서 이런 현실적인 장벽을 체감했습니다. 투자사들이 관심을 보이다가도 ‘투자를 받지 않은 한국 법인’이라는 점을 확인하고 실제 투자로 이어지지 않는 사례가 적지 않았습니다. 글로벌 경쟁 환경에서 자금 유치 역량이 중요한 만큼 이런 한계를 느낍니다.

또 하나는 현지 사업 운영상 불편함입니다. 예를 들어 일본에 진출해 B2B 계약을 체결하려 할 때, 일본 법인 간 계약, 자국 내 이체를 훨씬 선호하죠. 미국이나 유럽에서도 마찬가지입니다. 법인 형태 하나만으로도 여러 운영상의 마찰이 생길 수 있는 상황입니다.

그래서 최근 스타트업 사이에서는 전 세계적으로 통용되고, 인정받는 미국 법인을 설립하거나 플립을 고려하는 흐름이 많습니다. 저희도 같은 고민을 안고 있고 3~4년을 내다보며 중장기적으로 플립에 유리한 구조를 설계해 가는 단계입니다.

Q. 해외 법인 설립 현황은 어떤가요?

미국에 자회사를 보유하고 있고, 일본 자회사 설립을 진행 중입니다. 미국 법인은 델라웨어 주에 설립했습니다. 미국에서 기업법이 가장 발전한 곳이죠. 일본은 사무실이 있는 도쿄를 거점으로 활동하고 있습니다.

하지만 도쿄뿐 아니라 요코하마, 오사카, 후쿠오카 등 제2, 3 도시도 주목할 만합니다. 일본은 도시별 기능 분업이 강한 다핵화된 시장입니다. 특히 후쿠오카는 외국 스타트업 유치에 적극적이고, 지방 정부 차원의 자금 및 인프라 지원이 활발하게 이루어지고 있습니다. 후쿠오카시에 설립된 외국 기업에는 특정 조건을 갖추면 약 1억 원 규모의 지원을 제공하기도 하고요. 그래서 일본 대기업도 지점을 설치하는 추세입니다.

더플레이토는 2025년, 정주영 창업경진대회 글로벌 트랙의 액셀러레이팅 프로그램 '아산 보이저'에 선발되었다.
더플레이토는 2025년, 정주영 창업경진대회 글로벌 트랙의 액셀러레이팅 프로그램 ‘아산 보이저’에 선발되었다. (출처=아산나눔재단)

미국에서는 ‘대면 회의’ 집중, 타깃 사용자 좁고 깊게

Q. 최근 ‘아산 보이저’ 액셀러레이팅 프로그램에도 선정되셨습니다. 티로가 미국 시장에서 지닌 소구점은 한국 시장과 어떤 차이를 보이나요?

현재 미국 시장은 본격적으로 탐색하기 시작한 초기 단계입니다. 시장에 진입하면서 가장 많이 듣는 조언 중 하나가 ‘미국 사용자의 니즈는 매우 다르다’라는 점인데, 저희도 강하게 체감하고 있습니다.

이런 차이 속에서 저희는 ‘한국 기반의 티로가 잘하는 것이 무엇일까’를 고민했고, 그 답 중 하나가 ‘대면 미팅 환경에 특화된 AI 비서’라는 포지셔닝이었습니다. 미국은 지리적 특성상 서울, 도쿄와 달리 대면 미팅 자체가 드물고, 대부분 리모트 콜 기반으로 의사결정을 합니다.

이런 환경 차이 덕분에 티로는 오히려 ‘대면 미팅에 최적화된 기능과 사용성을 갖춘 제품’으로 차별화된 강점을 가질 수 있다고 판단했습니다. 실제로 글로벌 시장에서 유사한 보이스 AI 제품을 보면, 모바일 앱조차 없는 경우가 많고 국내 제품 수준의 기능도 보기 어렵습니다. 이러한 전략을 바탕으로, 미국에서도 대면 회의 문화가 남아 있는 도시나 산업군을 먼저 공략해 나가고자 합니다.

Q. 해외 사용자 확보 전략은 한국과 무엇이 다른가요?

한국과는 전혀 다른 방식으로 접근하고 있습니다. 한국에서야 저희가 한국인이기도 하고, 업계에 아는 분들이 많다 보니 인적 네트워크를 기반으로 초기 고객을 확보할 수 있었습니다. 하지만 미국이나 일본 시장에서는 ‘제품 자체의 문제 해결력’이 설득의 핵심이라고 느끼고 있습니다.

이런 관점에서 첫 사용 경험만으로 사용자로 전환하기 위한 프레이즈, 경험 설계를 깊이 고민하고 있습니다. 기본기에 더욱 집중하고, 제품의 본질로 설득하는 전략으로 돌아가는 중입니다.

Q. 개인정보 보호나 음성 데이터 활용의 규제와 인식 측면에서 국가별 차이도 클 것 같습니다. 티로는 이런 이슈에 대해 어떤 관점과 전략을 가지고 계십니까?

국가마다 법적 기준도 다르지만, 특히 문화적인 인식 차이가 매우 크다는 점에 주목하고 있습니다.

한국은 개인정보 보호법이 정교하지만, 일상에서의 프라이버시 민감도는 상대적으로 낮은 편입니다. 하지만 미국은 프라이버시에 대한 감도가 매우 높습니다. 예를 들어 사전고지 없이 녹음을 시작하면, 그 자체로 불쾌감을 유발해 관계에 타격을 줄 수도 있습니다.

그래서 미국에서는 기록이 진행되고 있다는 사실을 명확하게 고지하고, 동의를 구하는 절차 자체가 사용자 경험의 핵심이 됩니다. 줌이나 구글 밋에 미팅 봇을 초대하는 것도 사실상 ‘공식적인 고지 역할’을 수행하기 때문이라고 봅니다.

티로는 이에 대응해 기록 여부를 명확히 안내하고, 공동 편집 권한을 제공하는 등 문화적 민감도를 반영한 UX를 설계하고 있습니다.

인터뷰 중 실시간으로 내용을 요약해준다.
인터뷰 중 실시간으로 내용을 요약해준다. (제공=더플레이토)
Q. 최근 시드 투자를 유치하셨습니다. 투자금은 어떤 방향으로 활용하실 계획인가요?

이번 투자금은 팀 확장과 제품 품질 향상, 두 가지에 중점적으로 사용될 예정입니다.

팀 측면에서는 초기부터 뜻을 함께하며 무급으로 일해온 팀원들에게 처음으로 정식 급여를 제공할 수 있게 되었습니다. 그동안 파트타임으로 협업했던 분들도 정식 멤버로 합류시켜 고객 수요에 더욱 빠르게 대응할 수 있는 팀 구조를 마련할 계획입니다.

제품 측면에서는 아직 고도화되지 않은 품질과 높은 모델 비용 등 한계를 극복하기 위해 투자금을 활용하고자 합니다. 본래 6개월~1년 뒤에야 구현할 수 있었을 품질을 지금 당장 고객에게 제공할 수 있도록 품질 개선에 비용을 투입하고 있습니다.

Q. 향후 예정된 기능이나 서비스 확장 계획이 있으신가요? 비전을 듣고 싶습니다.

저희가 지향하는 궁극적인 방향은 ‘AI 메모리 어시스턴트’, 다시 말해 ‘기억력의 자전거’ 같은 제품을 만드는 것입니다. 자전거가 인간의 이동 능력을 확장했듯, 티로는 청각과 기억력의 한계를 넘어서 지적 생산성을 높여주는 도구가 되고자 합니다.

이러한 철학을 바탕으로 최근에는 모든 상황에서 기록이 가능하고, 더 나아가 사용자의 실질적인 업무를 돕는 기능을 준비하고 있습니다. 예를 들어 유저 인터뷰가 끝나면 버튼 한 번으로 모든 응답이 자동으로 채워진 정리 문서가 생성되며, 원문 인용까지 포함된 완성도 높은 결과물을 제공하는 기능입니다. 단순 요약을 넘어선 고도화된 자동 문서 생성으로, 사용자의 다음 행동을 대신 준비해 주는 능동적 역할로 나아가려 합니다.

더프론티어 인턴 기자 이유진입니다. 사회 혁신을 이끄는 기업에 관한 글을 씁니다. 새로운 아이디어와 비전을 깊이 있는 기사로 전달하겠습니다.

추천 기사

품격 있는 노년을 향한 기술의 동행, CES에서 만난 에이지테크

여성 90.7세, 남성 86.3세. 보험개발원이 국내 생명보험 가입자를 대상으로 측정해 올해 1월에 발표한 평균수명이다. 한국 여성 평균 수명이 처음으로 90세를 넘은 지금, 어르신에게 드리는...

숙면이 부족한 현대인에게, CES가 건네는 슬립테크

헬스케어는 CES 2024에서도 강한 존재감을 드러냈다. 여러 관 중 가장 큰 규모를 자랑한 디지털 헬스케어관에서는 전통적 수요층인 의료계보다 일반 소비자를 대상으로 한 제품들이 다수...

대체재인가, 동료인가? CES에서 만난 콘텐츠 AI

빗나간 예상, AI는 예술가의 적인가 2016년 한국고용정보원에서는 AI로 인한 대체가능성이 높거나 낮은 직업들의 순위를 발표했다. 이에 따르면 콘크리트공, 정육원 및 도축원, 조립원 등이 대체 가능성이...

위험을 통제해 혁명에 올라타는 방법, AI와 인간의 미래

AI는 CES 2024에서 가장 화두였다 해도 과언이 아니었다. 알파고가 이세돌과 맞붙었던 2015년만 해도 인공지능은 일부 전문분야에서 한정적으로 사용될 것이라는 생각이 많았다. 그로부터 8년이 지난...