안티그레비티가 뭔가요?
2025년 11월, 구글이 Gemini 3와 함께 공개한 안티그레비티(Antigravity)는 VS Code 기반의 AI 코딩 도구입니다. 이름 그대로 “무거운 코딩 작업에서 개발자를 해방시키겠다”는 의미를 담고 있습니다.

Cursor나 GitHub Copilot과 비슷하다고 생각할 수 있지만, 철학이 다릅니다. 이 도구는 에이전트 우선(Agent-first) 구조입니다. 개발자가 “이런 앱 만들어줘”라고 지시하면, AI 에이전트가 계획 수립 → 코딩 → 터미널 명령 실행 → 브라우저 테스트까지 전부 처리합니다.
저는 평소 ChatGPT, Claude, Gemini를 비교하면서 써왔는데, 안티그레비티에 Gemini 3.1 Pro가 올라왔다는 소식을 듣고 바로 테스트해봤습니다.
Gemini 3.1 Pro, 뭐가 달라졌나
2026년 2월 19일, 구글이 Gemini 3.1 Pro 프리뷰를 공개했습니다. 전작인 Gemini 3 Pro와 가격은 동일하면서 성능이 크게 올랐습니다.
벤치마크 수치를 보면:
- ARC-AGI-2: 77.1% (Gemini 3 Pro는 31.1%, 두 배 이상)
- SWE-Bench Verified: 80.6% (코드 문제 해결 능력)
- GPQA Diamond: 94.3% (과학·추론 난이도 최고 수준)
특히 SWE-Bench 80.6%는 실제 GitHub 이슈를 AI가 해결하는 벤치마크인데, 이 정도면 코딩 에이전트로서 상당히 쓸만한 수준입니다. 기존 Gemini 사용법 가이드에서 다뤘던 것과 비교하면 확실히 세대가 바뀐 느낌입니다.
안티그레비티 첫인상 — 설치부터 실행까지
이 도구는 현재 공개 프리뷰 상태로, 무료로 사용할 수 있습니다. VS Code를 기반으로 만들어져서 인터페이스가 익숙합니다. 기존 VS Code 확장 프로그램도 대부분 호환됩니다.
설치 후 첫 화면에서 가장 눈에 띄는 건 모델 선택 드롭다운입니다. Gemini 3.1 Pro, Gemini 3 Pro(High/Low), Claude Sonnet 4.5, GPT-OSS 120B를 자유롭게 전환할 수 있습니다. 하나의 도구에서 여러 AI 모델을 돌려볼 수 있다는 건 확실한 장점입니다.
저는 Gemini 3.1 Pro를 기본 모델로 설정하고 테스트를 시작했습니다.
에이전트 모드 — 직접 써본 결과
안티그레비티의 핵심은 에이전트 모드입니다. “이런 기능을 만들어줘”라고 지시하면 AI가 알아서 파일을 만들고, 코드를 작성하고, 터미널에서 명령을 실행합니다.
제가 테스트한 작업은 간단한 Flask 대시보드 만들기였습니다. “사용자 목록을 보여주는 Flask 웹앱을 만들어줘. SQLite를 쓰고, 부트스트랩으로 꾸며줘”라고 입력했습니다.
결과는 꽤 인상적이었습니다:
- 프로젝트 구조를 먼저 계획하고 Task Plan을 보여줌
app.py,models.py,templates/폴더를 자동 생성- 터미널에서
pip install flask까지 알아서 실행 - 브라우저에서 결과를 스크린샷으로 캡처해서 확인까지 해줌
Cursor도 에이전트 모드가 있지만, 이 도구는 작업 과정을 문서화한다는 점이 다릅니다. Task Plan, Implementation Plan, 스크린샷, 테스트 결과를 전부 기록으로 남깁니다. Google Docs처럼 코멘트를 달아서 “여기 이렇게 바꿔줘”라고 피드백할 수도 있습니다.
토큰 제한 — 가장 큰 불만
여기서부터 문제가 시작됩니다.
이 도구를 30분 정도 쓰다 보면 “토큰 제한에 도달했습니다”라는 메시지가 뜹니다. Gemini 3.1 Pro가 막히면 Gemini 3 Pro Low로 바꿔보는데, 이것도 금방 막힙니다. Gemini 3 Pro High와 Low가 쿼터를 공유하기 때문입니다.
그래서 Claude Sonnet 4.5로 전환했는데, 이것도 생각보다 빨리 제한에 걸렸습니다. GPT-OSS 120B까지 돌아가면 하루에 4개 모델을 전부 소진하는 상황이 벌어집니다.
무료 프리뷰니까 어느 정도 이해하지만, 실무에서 하루 종일 쓰기엔 턱없이 부족합니다. Claude Code는 Pro 구독($20/월)으로 상당히 넉넉하게 쓸 수 있는 것과 비교하면 아쉬운 부분입니다.
안티그레비티 vs Cursor vs Claude Code
제가 세 가지를 모두 써본 입장에서 비교하면:
| 항목 | 안티그레비티 | Cursor | Claude Code |
|---|---|---|---|
| 기반 | VS Code 포크 | VS Code 포크 | 터미널 CLI |
| 에이전트 모드 | 강력 (병렬 에이전트) | 있음 | 강력 (MCP 연동) |
| 모델 선택 | Gemini/Claude/GPT 전환 | Claude/GPT 선택 | Claude 전용 |
| 가격 | 현재 무료 | $20/월 | $20/월 (Pro) |
| 토큰 제한 | 빡빡함 | 넉넉함 | 넉넉함 |
| 안정성 | 가끔 버그 | 안정적 | 안정적 |
| 특수 기능 | 작업 문서화, 브라우저 테스트 | 코드베이스 인덱싱 | MCP 서버 연동 |
안티그레비티의 강점은 멀티 모델 지원과 작업 문서화입니다. 하나의 도구에서 Gemini도 쓰고 Claude도 쓸 수 있다는 건 다른 도구에 없는 장점입니다. 하지만 토큰 제한이 실무에서 발목을 잡습니다.
현재 시점에서 실무용으로는 Cursor나 Claude Code가 더 안정적이고, 안티그레비티는 “앞으로 기대되는 도구”에 가깝습니다.
보안 이슈 — 주의할 점
한 가지 짚고 넘어갈 부분이 있습니다. BetterStack에서 안티그레비티의 .env 파일 유출 가능성을 경고한 바 있습니다. 에이전트가 터미널 명령을 실행할 수 있다는 건 편리하지만, 민감한 환경변수가 AI에 노출될 수 있다는 뜻이기도 합니다.
회사 프로젝트에서 이 도구를 쓸 계획이라면, API 키나 데이터베이스 비밀번호가 담긴 .env 파일을 별도로 관리하거나, 에이전트의 터미널 접근 권한을 제한하는 것을 권장합니다.
Gemini 3.1 Pro 코딩 성능 — 실제로 써보니
벤치마크 숫자는 인상적인데, 실제로 코딩할 때는 어떨까요?
제가 느낀 Gemini 3.1 Pro의 코딩 능력:
잘하는 것: Python 코드 생성, API 연동, 데이터 처리 로직은 상당히 정확했습니다. Flask 앱을 만들 때 SQLAlchemy 모델 정의부터 라우팅까지 한 번에 깔끔하게 만들어냈습니다. 에러 핸들링도 알아서 넣어줬습니다.
아쉬운 것: 프론트엔드 작업에서는 Claude보다 한 수 아래였습니다. CSS 레이아웃을 잡을 때 세부적인 부분에서 틀리는 경우가 있었고, React 컴포넌트 구조도 Claude Code가 더 깔끔하게 잡아줬습니다.
특이한 점: 코드 설명이 상당히 상세합니다. 주석과 docstring을 꼼꼼하게 달아주는 편이고, “왜 이렇게 구현했는지”까지 설명해줍니다. 학습 목적으로는 오히려 Claude보다 나을 수 있습니다.
마치며 — 써볼 만한 가치는 있습니다
안티그레비티는 아직 프리뷰 단계이고, 토큰 제한이라는 명확한 약점이 있습니다. 하지만 에이전트 우선 설계와 멀티 모델 지원은 다른 도구에 없는 강점입니다. Gemini 3.1 Pro의 추론 능력 향상도 체감됩니다.
제 결론은 이렇습니다:
- 실무 메인 도구로는 아직 이르다 — 토큰 제한과 안정성 때문
- 보조 도구로는 충분하다 — 특히 빠르게 프로토타입을 만들 때
- 학습 목적으로는 추천 — Gemini 3.1의 상세한 코드 설명이 좋음
구글이 토큰 제한을 풀고 안정성을 잡으면, Cursor의 강력한 경쟁자가 될 겁니다. 무료인 지금 한번 써보고, 자기 워크플로우에 맞는지 판단해보시길 추천합니다.