AI NEWS

"Google, Gemini Robotics 공개! AI 로봇 지능의 새로운 시대를 열다!"

제목이 "Google이 Gemini Robotics를 공개했습니다. 이는 AI 로봇 지능의 새로운 수준입니다!"인 이 기사는 Google의 AI 부서인 DeepMind에서 최근 Gemini Robotics를 소개한 내용을 다룹니다. 다음은 주요 사항입니다:

Gemini Robotics의 소개
DeepMind는 로봇 혁신을 위해 설계된 두 가지 고급 AI 모델인 Gemini Robotics와 Gemini Robotics-ER을 출시했습니다. 이 모델들은 강력한 Gemini 2.0 대규모 언어 모델을 기반으로 하며, 시각, 언어, 행동 기능을 통합하고 있습니다.

주요 기능
- 시각-언어-행동 모델 : Gemini Robotics는 비디오 피드를 통해 주변 환경을 인식하고 자연어 지시를 이해하며, 로봇을 제어하는 물리적 행동을 생성할 수 있습니다. 이를 통해 로봇은 종이접기, 간식 포장, 요리 준비 등의 복잡한 작업을 수행할 수 있습니다.
- 일반화 능력 : 이 모델은 새로운 물체와 다양한 지시, 새로운 환경을 처리할 수 있어 새로운 상황에 일반화할 수 있습니다. 일반화 기준에서 이전 최첨단 모델보다 더 나은 성능을 보였습니다.
- 상호 작용성 : 로봇은 일상적인 명령을 이해하고 반응할 수 있으며, 추가 입력 없이 갑작스러운 지시나 환경의 변화에 적응할 수 있습니다.
- 정교함 : 이 모델은 종이접기나 샐러드 준비와 같이 정밀한 조작이 필요한 복잡한 작업을 수행할 수 있도록 합니다.

파트너십 및 응용
DeepMind는 Gemini Robotics를 다양한 로봇 플랫폼에 적용하기 위해 Apptronik, Boston Dynamics, Agility Robotics 등 여러 로봇 회사와 협력하고 있습니다. 예를 들어, Apptronik의 Apollo 휴머노이드 로봇과 Boston Dynamics의 Atlas 로봇이 이러한 모델로 더욱 스마트하고 새로운 환경에 적응할 수 있도록 개선되고 있습니다.

고급 공간 추론
Gemini Robotics-ER 모델은 Embodied Reasoning의 약자로, 고급 공간 이해 능력을 갖추고 있습니다. 이를 통해 AI는 물체가 물리적 공간에서 어떻게 존재하는지, 어떻게 이동할 수 있는지, 로봇 팔이 물체를 잡기 위한 경로를 계획할 수 있는 방법을 파악할 수 있습니다.

안전 및 기준
이 모델은 Isaac Asimov의 이름을 딴 의미 기반 안전 계층을 포함하고 있어, 로봇이 행동의 안전성 여부를 판단할 수 있도록 합니다. Gemini Robotics는 ASIMOV 데이터 세트에서 테스트되었으며, 신체적 상해나 기타 안전하지 않은 사건이 발생할 수 있는 상황을 인식하는 데 강력한 성능을 보여주었습니다.

영향
이러한 발전은 로봇 혁신에서 중요한 도약을 나타내며, 로봇이 현실 세계에서의 다양성과 문제 해결 능력을 더욱 향상시킬 것으로 기대됩니다. 이 모델들은 로봇을 실제로 유용하고 사용자 친화적이며 일상적인 상황에서 안전하게 만들 것으로 보입니다.