본문 바로가기
 

정부 R&D 사업 연구비 계상 빠르게 마무리하기

회사에서 정부 R&D 사업을 하는데 연구비 계상이 막막하신가요?...

AI 활용/[뉴스] AI 소식

2026년 05월 03일 AI 기술·기능 뉴스 TOP 5

by RnD터미널 2026. 5. 3.
반응형

2026년 4월 마지막 주, AI 업계는 단순한 모델 출시를 넘어 '에이전트 인프라 전쟁'의 본격적 막이 올랐음을 보여주는 한 주였습니다. 구글, OpenAI, 메타, 마이크로소프트, 그리고 오픈소스 진영의 Ai2까지 — 각자의 전선에서 발표된 핵심 뉴스 5건을 정리했습니다.

1. 구글, Gemini 3.1 Pro 기반 'Deep Research Max' 공개 — 자율 리서치 에이전트의 분기점

📰 원본 기사 보기 →

구글은 4월 30일, 자사 플래그십 모델 Gemini 3.1 Pro를 기반으로 한 차세대 자율 리서치 에이전트 Deep Research Max를 정식 공개했습니다. 기존 Deep Research 대비 분석 깊이와 정확도를 크게 끌어올린 것이 특징이며, 장시간 실행되는 정확도 중심 워크플로에 최적화되었습니다.

  • MCP(Model Context Protocol) 네이티브 지원으로 외부 데이터 소스·기업 내부 시스템과 단일 API 호출로 연결
  • 리서치 결과를 네이티브 시각화(차트·다이어그램)로 자동 생성
  • 주요 리서치 벤치마크에서 업계 1위 성능을 기록했다고 구글은 밝힘
  • Gemini API에 'deep-research-max-preview-04-2026' 형태로 즉시 호출 가능

💡 Deep Insight

Deep Research Max는 단순한 챗봇 업그레이드가 아니라, '리서치'라는 화이트칼라 직무 자체를 API화하려는 시도입니다. MCP를 네이티브로 채택했다는 점은 향후 OpenAI·Anthropic의 에이전트 생태계와 상호운용 가능한 표준으로 수렴 중이라는 신호입니다. Gemini Enterprise Agent Platform과 결합하면, 기업은 'GPT 대안'이 아니라 '리서치 워커 한 명을 채용하는 비용 모델'로 AI를 평가하기 시작할 것입니다.


2. OpenAI 모델, 드디어 AWS Bedrock에 상륙 — MS 독점 종료 직후 전격 발표

📰 원본 기사 보기 →

4월 28일, AWS와 OpenAI는 전략적 파트너십 확장을 공식 발표했습니다. 이로써 OpenAI의 최신 GPT 모델, Codex 코딩 에이전트, Managed Agents가 Amazon Bedrock을 통해 처음으로 일반 기업 고객에게 제공됩니다. 마이크로소프트의 클라우드 독점 계약이 만료된 바로 다음 날에 발표된 것이라 업계의 충격이 컸습니다.

  • Bedrock의 Managed Agents 및 AgentCore 플랫폼에서 GPT 모델 직접 호출 가능
  • 기업 고객은 자사 AWS 환경 내에서 데이터를 외부로 내보내지 않고 OpenAI 모델 활용 가능 (제한적 프리뷰)
  • Codex 에이전트가 AWS 개발 워크플로(IAM, S3, Lambda 등)와 네이티브 통합

💡 Deep Insight

이 발표의 핵심은 '모델의 가용성'이 아니라 '프론티어 모델의 멀티-클라우드化'가 시작됐다는 점입니다. 그동안 Anthropic이 AWS·GCP를 양쪽에서 활용해 OpenAI를 압박했다면, 이제는 OpenAI도 동일한 카드를 쥐게 된 셈입니다. 기업 고객 입장에서는 벤더 락인 리스크가 완화되어 협상력이 강해지지만, 마이크로소프트의 Azure-OpenAI 차별화 전략에는 균열이 불가피합니다.


3. 메타 'Muse Spark'에 Contemplating 모드 탑재 — 16개 에이전트 병렬 추론

📰 원본 기사 보기 →

메타가 4월 28일, 신모델 Muse Spark(코드명 Avocado)에 Contemplating 모드를 정식 탑재했습니다. 이 모드는 16개의 에이전트가 동시에 병렬로 추론한 뒤 결과를 종합해 답변을 생성하는 멀티-에이전트 오케스트레이션 방식으로, OpenAI o-시리즈와 Anthropic의 추론 모델에 정면으로 맞대응한다는 의미가 있습니다.

  • Muse Spark는 알렉산드르 왕의 Meta Superintelligence Labs(MSL)가 14억 달러 투자 이후 내놓은 첫 모델
  • Contemplating 모드는 복잡한 문제에 대해 다중 에이전트가 독립적 추론 → 합의 → 통합 응답 절차를 수행
  • Meta AI 앱과 meta.ai 웹에서 단계적으로 롤아웃
  • 멀티모달 입력(텍스트·이미지·음성) 지원

💡 Deep Insight

메타의 Contemplating 모드는 단일 모델의 추론 사슬(CoT)을 늘리는 OpenAI 방식과 달리, '여러 모델 인스턴스의 합의'를 통해 답을 생성합니다. 이는 추론 비용은 증가하지만, 하나의 모델이 환각을 일으켜도 다수결로 보정할 수 있다는 강력한 장점이 있습니다. 메타가 Llama의 오픈웨이트 노선에서 폐쇄형·고성능 노선으로 전략을 명확히 선회한 분기점이라는 평가가 나옵니다.


4. Ai2, 오픈소스 비주얼 웹 에이전트 'MolmoWeb' 공개 — 학습 데이터까지 전면 공개

📰 원본 기사 보기 →

앨런 인공지능 연구소(Ai2)가 4월 28일 출시한 MolmoWeb은 스크린샷만으로 브라우저를 조작·자율 작업 수행이 가능한 오픈웨이트 비주얼 웹 에이전트입니다. OpenAI Operator, Anthropic Computer Use, Google Project Mariner 등 폐쇄형 시스템에 정면으로 도전하는 첫 본격 오픈소스 대안입니다.

  • 4B / 8B 두 가지 사이즈로 출시, Molmo 2 모델 패밀리 기반
  • 전체 학습 데이터셋 MolmoWebMix(약 30,000건의 사람이 주석한 웹 작업)도 함께 공개
  • 스크린샷 기반으로 브라우저 내 클릭·입력·내비게이션 자율 수행 (DOM 의존성 없음)
  • 학습 코드, 평가 하네스, 어노테이션 도구까지 풀 스택으로 오픈소스화

💡 Deep Insight

컴퓨터 사용(Computer Use) 기술은 그동안 빅테크의 영역이었지만, MolmoWeb은 학습 데이터 전체를 공개함으로써 그 진입장벽을 결정적으로 낮췄습니다. 기업이 자체 도메인(예: ERP, 사내 SaaS)에 특화된 에이전트를 직접 파인튜닝할 수 있는 길이 열린 것입니다. 'Operator를 쓰겠는가, 우리만의 Operator를 만들겠는가'라는 질문이 향후 12개월 내 모든 엔터프라이즈의 의사결정 안건이 될 것입니다.


5. 마이크로소프트 365 Copilot 4월 업데이트 — 음성·노트북·Excel Plan 모드 대거 추가

📰 원본 기사 보기 →

마이크로소프트는 4월 말 Microsoft 365 Copilot의 대규모 업데이트(약 41개 신기능)를 공개했습니다. 모바일 앱은 채팅 우선(chat-first) 디자인으로 전면 개편되었으며, 코파일럿 노트북, Excel 자동화, 이미지 편집 등 일상 업무 도구 전반에 에이전트 기능이 확장되었습니다.

  • Voice Chat: 모바일 앱에서 음성 기반 대화·작업 지시 지원
  • Copilot in Excel: Plan 모드와 Python 실행 지원으로 자율 데이터 분석·시각화 가능
  • Copilot Notebooks: SharePoint, OneNote 콘텐츠를 단일 노트북으로 그라운딩, 자동 요약·정리
  • 이미지 편집 옵션 및 공개 웹사이트 그라운딩 추가로 외부 정보 활용 강화
  • Sales 에이전트에 AI 기반 영업 기회 요약 자동 생성 기능 탑재

💡 Deep Insight

OpenAI의 AWS 진출로 충격을 받은 시점에 마이크로소프트가 곧장 Copilot의 '워크플로 깊이'로 응수한 셈입니다. 핵심은 Excel의 Plan 모드 — 사용자가 결과만 지정하면 Copilot이 스스로 계획을 세우고 Python을 실행합니다. 이는 단순한 부가 기능이 아니라, 마이크로소프트가 'OS·생산성 도구의 두꺼운 데이터 컨텍스트'라는 자사만의 해자를 무기화하기 시작했다는 신호입니다.


🎯 종합 전망

이번 주를 관통한 키워드는 단연 '에이전트 플랫폼화'입니다. 구글은 Deep Research Max로 '리서처'를, 메타는 Contemplating 모드로 '집단 추론'을, OpenAI는 AWS 진출로 '플랫폼 중립성'을, Ai2는 MolmoWeb으로 '오픈소스 컴퓨터 사용'을, 마이크로소프트는 Copilot으로 '생산성 워크플로'를 각각 자기 영역으로 선언했습니다.

주목할 점은 다섯 회사가 전혀 다른 전선에서 싸우고 있다는 사실입니다. 더 이상 '누구의 LLM이 더 똑똑한가'가 경쟁축이 아니며, '누가 어떤 워크플로를 가장 깊이 통합하는가'가 새로운 승부처가 되고 있습니다. 특히 MCP가 구글·OpenAI·Anthropic 모두에서 사실상 표준으로 자리잡으며, 향후 에이전트 간 상호운용성(interoperability)이 차세대 핵심 키워드가 될 가능성이 높습니다.

5월 19일 시작될 Google I/O 2026에서 Gemini 3.5 또는 4.0급 모델이 공개될 가능성이 높고, 엔비디아의 5월 20일 1분기 실적 발표에서 Rubin 양산 일정이 구체화될 전망입니다. 5월 셋째 주가 다음 변곡점이 될 것으로 보입니다.

728x90
반응형
LIST