MS 가 이제 자기 엔진도 만들기 시작했다
MS 가 이제 자기 엔진도 만들기 시작했다
“마이크로소프트가 이제 남의 엔진만 빌려 쓰지 않고, 자기 엔진도 만들기 시작했다”는 이야기입니다. 당장 갈라선다는 뜻은 아니지만, 선택지를 늘려 협상력과 품질을 동시에 챙기려는 움직임입니다.
오픈AI 같은 파트너의 강점을 계속 쓰되, 핵심 경험은 우리 손으로 만들고 가격과 속도도 우리가 책임지겠다는 뜻입니다.
실제로 회사는 2024년부터 소형 공개모델 파이 시리즈(Phi-3, Phi-3.5) 같은 작고 빠른 모델을 공개했고, 2025년에는 파이-4 라인과 멀티모달 모델까지 내놓았습니다. 최근에는 MAI-1이라는 대형 모델을 자사 클러스터에서 학습했다는 발언도 나왔습니다. 즉, 작은 모델과 큰 모델을 모두 스스로 굴려보는 단계에 들어선 것입니다.
무엇이 새로 나왔나요
이번에 공개한 건 두 가지입니다. 첫째, MAI-Voice-1 입니다. 말 그대로 “말 잘하는 AI”로, 1초도 안 되는 시간에 1분짜리 오디오를 뚝딱 만들어 냅니다. 실사용에서는 회의 요약을 읽어 주거나, 팟캐스트 느낌으로 콘텐츠를 말로 풀어 주는 등의 쓰임새가 큽니다. 벌써 코파일럿 데일리와 팟캐스트 기능에 들어가 있고, Copilot Labs에서 체험용 데모도 열려 있습니다. 둘째, MAI-1-preview 입니다. 마이크로소프트가 처음부터 끝까지 직접 훈련했다고 밝힌 텍스트 LLM으로, 커뮤니티 평가 사이트인 LMArena에서 공개 테스트 중입니다. 곧 코파일럿의 일부 텍스트 작업에 시험 투입해 사용자 피드백을 모으겠다는 계획입니다.
왜 직접 만들까요
비용과 속도, 그리고 안정성 때문입니다. 모든 질문을 거대한 클라우드 모델로 처리할 필요는 없습니다. 이메일 요약, 티켓 분류, 간단한 답변 같은 일은 더 저렴하고 빠른 모델로도 충분합니다. 반면 어려운 작업이나 고품질이 필요한 부분은 여전히 초거대 모델이 유리합니다. 마이크로소프트는 “우리 모델 + 파트너 모델 + 오픈소스 모델”을 상황에 맞게 섞어 쓰겠다고 못 박았습니다. 최근에는 앤스로픽 모델을 Microsoft 365에 일부 적용한다는 보도도 나왔습니다. 한 회사에 올인하지 않고 여러 모델을 쓰겠다는 뜻입니다.
오픈AI와의 관계는 어떻게 되나요
완전한 결별 시그널이라기보다 ‘멀티모델’ 전략으로 보입니다. 물론 양사 사이에 계약·독점·AGI 조항을 둘러싼 긴장 보도가 이어졌고, 내부에서도 더 큰 훈련 클러스터를 갖춰 자립도를 높이겠다는 언급이 있었습니다. 하지만 동시에 “상황에 맞게 최고의 모델을 쓰겠다”는 원칙을 반복해 말합니다. 즉, 코파일럿은 하나의 두뇌가 아니라 여러 두뇌의 합주가 될 가능성이 큽니다.
왜 ‘음성’부터 손댔을까요
요즘 생성형 AI에서 음성 인터페이스는 가장 체감이 큰 분야입니다. 한편 오픈AI의 음성 모드를 두고 “너무 들쭉날쭉하다”, “표현이 과장되거나 일관성이 없다”는 사용자 피드백도 커뮤니티에 여럿 올라왔습니다. 마이크로소프트가 음성 모델을 먼저 내놓은 건, 이 경험을 우리가 직접 책임지겠다는 메시지로도 읽힙니다. 제가 실제 업무에서 느끼기로도 음성은 딜레이 몇 백 ms 차이만 나도 만족도가 확 달라집니다. MAI-Voice-1처럼 초저지연 합성이 가능해지면, 회의 도우미나 내비게이션, 스크린 없는 상황에서의 조작성이 훨씬 좋아집니다.
MAI-1-preview, 지금 당장 얼마나 똑똑한가요
아직 ‘미리보기’라 섣불리 단정하긴 어렵습니다. 일부 매체는 LMArena 초기 순위가 상위권과 격차가 있다고 전하지만, 공개 테스트는 본격 개선을 위한 워밍업에 가깝습니다. 중요한 건 방향성입니다. 회사는 앞으로 더 큰 훈련 클러스터를 가동하겠다고 밝혔고, 코파일럿의 텍스트 과업 일부에서 비용·지연을 낮추는 용도로 먼저 쓰겠다고 예고했습니다. 즉, “작은 승리부터 쌓겠다”는 접근입니다.
실전에서 어떻게 고르면 좋을까요
현업에서 가장 실속 있는 방법은 과업별 모델 쪼개기 입니다. 반복·규모형 업무(요약·분류·자동응대)는 MAI-1-preview 같은 비용 효율 모델로, 고객 대면·코딩 보조·리스크 큰 업무는 오픈AI·앤스로픽 등 상위 모델을 기본으로 쓰되 필요 시 대체 가능합니다. 음성은 MAI-Voice-1과 기존 스택을 병행 테스트해 지연·중단·자연스러움을 점수화하면 의사결정이 쉬워집니다. 경험상 프롬프트 포맷, 보안 정책, 로깅 기준을 미리 표준화해두면 모델을 바꿔도 운영 충격이 작습니다.
결국 무엇을 의미하나요
이번 발표는 “챗GPT를 당장 대체한다”가 아니라 “코파일럿의 엔진을 다중화한다”는 신호입니다. 음성은 자체 모델로 사용감을 끌어올리고, 텍스트는 프리뷰 모델로 비용·지연을 깎아보며, 어려운 과업은 여전히 최상급 모델을 씁니다. 여기에 앤스로픽 같은 제3의 선택지도 더합니다. 사용자는 더 나은 품질과 더 낮은 비용, 더 빠른 응답이라는 실익을 기대할 수 있고, 마이크로소프트는 기술·비용·협상에서 주도권을 조금 더 가져올 수 있습니다.
결과적으로 우리는 더 빠른 응답, 낮은 비용, 더 일관된 품질의 AI를 만나게 될 가능성이 큽니다.
2025.08.29 - [AI] - 바이브코딩과 일회용 소프트웨어의 시대
2025.08.23 - [AI] - 생성형 AI 도구, 업무용 소프트웨어 기업의 생존 전략
2025.08.18 - [AI] - 글로벌 빅테크 기업들의 AI 클라우드 전쟁과 2025년 2분기 실적 분석
2025.08.04 - [AI] - AI 개발에 필요한 막대한 자원: 기술 독점 문제
Microsoft hires Inflection founders to run new consumer AI division | TechCrunch
Microsoft has hired Mustafa Suleyman and Karén Simonyan, co-founders of high-profile AI startup Inflection AI, and several of their colleagues in one of Microsoft has hired Mustafa Suleyman and Karen Simonyan, co-founders of high-profile AI startup Inflec
techcrunch.com
Microsoft is making “significant investments” in training its own AI models
There are more Microsoft AI models to come
www.theverge.com
Phi Open Models - Small Language Models | Microsoft Azure
Explore Phi models, efficient small language models (SLMs) for generative AI applications. Learn more about Phi in Azure AI Foundry.
azure.microsoft.com