AI·에이전트

Gemini(제미니) 간단 정리

· · 추천 1 · 댓글 3 · 조회 364

Google이 만든 멀티모달 AI입니다. 텍스트뿐 아니라 이미지·비디오·오디오까지 통째로 이해하고, 구글 생태계와 직접 묶여 돌아가는 게 가장 큰 특징이에요.

특징 세 가지 짚자면,

먼저 2M 토큰 컨텍스트. 책 한 권이나 코드베이스 전체, 심지어 1시간짜리 영상도 한 번에 던질 수 있습니다. "이 영상 5분 32초에 뭐가 나와요?" 같은 질문이 가능해요.

다음은 멀티모달 처리. 이미지나 영상 분석이 단순 캡션 수준이 아니라, 화면 속 UI 흐름이나 코드 스크린샷까지 읽어냅니다. 디자인 시안 던져주고 "이거 React로 만들어줘" 같은 작업이 잘 돌아갑니다.

마지막은 구글 서비스 연동. Gmail·Drive·YouTube·Calendar를 직접 들여다봅니다. "지난주 회의록 찾아서 요약해줘" 한 마디에 Drive 검색까지 같이 처리돼요.

모델은 Gemini 2.5 Pro/Flash 라인업이고, 별도로 Gemini CLI도 있어서 터미널에서 무료로 하루 1,000회까지 쓸 수 있습니다.

긴 자료 통째로 분석하거나, 영상·이미지가 섞인 작업, 또는 구글 워크스페이스 위에서 일하는 분들에게 특히 잘 맞아요. 🎥