ภาพรวมโหมด Agent

เอกสารนี้อธิบายโหมด Agent ใน Gemini Code Assist

โหมด Agent พร้อมใช้งานในสภาพแวดล้อมการพัฒนาแบบผสานรวม (IDE) ของ VS Code และ IntelliJ หากต้องการเริ่มใช้โหมด Agent โปรดดูหัวข้อ ใช้โหมด Agent ของ Gemini Code Assist

โหมด Agent ช่วยให้คุณทำสิ่งต่อไปนี้และอื่นๆ ได้

  • ถามคำถามเกี่ยวกับโค้ด
  • ใช้บริบทและเครื่องมือในตัวเพื่อปรับปรุงเนื้อหาที่สร้างขึ้น
  • กำหนดค่าเซิร์ฟเวอร์ MCP เพื่อขยายความสามารถของ Agent
  • รับโซลูชันสำหรับงานที่ซับซ้อนซึ่งมีหลายขั้นตอน
  • สร้างโค้ดจากเอกสารการออกแบบ ปัญหา และความคิดเห็น TODO
  • ควบคุมลักษณะการทำงานของ Agent โดยแสดงความคิดเห็น แก้ไข และอนุมัติแผนและการใช้เครื่องมือระหว่างการดำเนินการ

วิธีการทำงานของโหมด Agent

ในโหมด Agent ระบบจะส่งพรอมต์ของคุณไปยัง Gemini API พร้อมกับรายการ เครื่องมือที่พร้อมใช้งาน Gemini API จะประมวลผลพรอมต์และแสดงผลการตอบกลับ การตอบกลับอาจเป็นคำตอบโดยตรงหรือคำขอให้ใช้เครื่องมือที่พร้อมใช้งาน

เมื่อมีการขอใช้เครื่องมือ Agent จะเตรียมพร้อมที่จะใช้เครื่องมือและตรวจสอบว่าได้รับอนุญาตให้ใช้เครื่องมือหรือไม่ โดยมีหรือไม่มีการขออนุญาตอย่างชัดแจ้ง ดังนี้

  • สำหรับคำขอใช้เครื่องมือที่แก้ไขระบบไฟล์หรือดำเนินการเปลี่ยนแปลงทรัพยากรใดๆ Gemini จะขอให้คุณอนุญาตการดำเนินการดังกล่าว เว้นแต่คุณจะกำหนดค่าให้ Gemini อนุญาตเครื่องมือหรือเครื่องมือต่างๆ เสมอ
  • คำขอใช้เครื่องมือแบบอ่านอย่างเดียวอาจไม่ขอสิทธิ์ก่อนที่จะทำงานให้เสร็จสมบูรณ์

เมื่อระบบขอให้คุณอนุญาตการใช้เครื่องมือ คุณสามารถเลือกอนุญาตหรือปฏิเสธการดำเนินการได้ นอกจากนี้ Agent อาจให้ตัวเลือกในการอนุญาตเครื่องมือหรือเซิร์ฟเวอร์เสมอ หรืออนุญาตการดำเนินการที่คล้ายกัน ดูข้อมูลเพิ่มเติมได้ที่ อนุญาตการดำเนินการของ Agent เสมอ

เมื่อได้รับอนุญาตให้ใช้เครื่องมือหรืออนุญาตตัวเองแล้ว Agent จะใช้เครื่องมือเพื่อดำเนินการที่จำเป็นให้เสร็จสมบูรณ์ และระบบจะส่งผลลัพธ์ของการดำเนินการนั้นกลับไปยัง Gemini API Gemini จะประมวลผลผลลัพธ์ของการดำเนินการของเครื่องมือและสร้างการตอบกลับอีกครั้ง วงจรการดำเนินการและการประเมินนี้จะดำเนินต่อไปจนกว่างานจะเสร็จสมบูรณ์

สำหรับงานที่ซับซ้อน Gemini อาจแสดงแผนระดับสูงเพื่อให้คุณอนุมัติ คุณสามารถปรับแต่งแผนและถามคำถามในแชทก่อนเริ่มกระบวนการได้ เมื่อพอใจกับแผนแล้ว คุณก็อนุมัติได้ หลังจากอนุมัติแผนแล้ว Agent จะเริ่มทำงานแรก และจะขอคำชี้แจงหรือสิทธิ์จากคุณตามความจำเป็นขณะดำเนินการตามแผน

บริบทของโหมด Agent

บริบทช่วยให้ Agent สร้างการตอบกลับที่ดีขึ้นสำหรับพรอมต์ที่กำหนดได้ ระบบสามารถดึงบริบทจากไฟล์ใน IDE, ไฟล์ในโฟลเดอร์ระบบในเครื่อง, การตอบกลับของเครื่องมือ และรายละเอียดพรอมต์

Agent อาจเข้าถึงบริบทที่แตกต่างกันได้ ทั้งนี้ขึ้นอยู่กับ IDE และการตั้งค่า

แท็บต่อไปนี้แสดงรายละเอียดเกี่ยวกับวิธีรวบรวมบริบทสำหรับ IDE ต่างๆ

VS Code

โดยปกติแล้ว Gemini Code Assist ในโหมด Agent จะเข้าถึงบริบทได้ด้วยวิธีต่อไปนี้

  • ข้อมูลในพื้นที่ทำงาน IDE
  • การตอบกลับของเครื่องมือจากเครื่องมือในตัว เช่น grep, เทอร์มินัล, การอ่านไฟล์ หรือการเขียนไฟล์
  • การตอบกลับของ Google Search
  • เนื้อหาจาก URL ที่ระบุในพรอมต์หรือโดยเครื่องมือ
  • ไฟล์บริบทที่คุณสร้างในมาร์กดาวน์

IntelliJ

โดยปกติแล้ว Gemini Code Assist ในโหมด Agent จะเข้าถึงบริบทได้ด้วยวิธีต่อไปนี้

  • ข้อมูลในโปรเจ็กต์ IDE ซึ่งรวมถึงไฟล์ สัญลักษณ์ที่จัดทำดัชนี และการใช้สัญลักษณ์ในโปรเจ็กต์
  • การตอบกลับของเครื่องมือจากเครื่องมือในตัว เช่น grep, การอ่านไฟล์ หรือการเขียนไฟล์
  • การควบคุมเวอร์ชันของ IntelliJ
  • เซิร์ฟเวอร์และเครื่องมือ MCP ที่กำหนดค่าไว้
  • ไฟล์บริบทที่คุณสร้างในมาร์กดาวน์

คุณสามารถดูบริบทที่ Agent เข้าถึงได้ในลิ้นชักบริบทในพื้นที่พรอมต์แชทของโหมด Agent

ลิ้นชักบริบทของโหมด Agent

เครื่องมือ

เครื่องมือ เป็นหมวดหมู่บริการที่หลากหลายซึ่ง Agent สามารถใช้สำหรับบริบทและการดำเนินการในการตอบกลับพรอมต์ของคุณ เครื่องมือช่วยให้ Agent เข้าถึงข้อมูลล่าสุดได้ผ่านการเรียกฟังก์ชันไปยังปลายทาง API หรือไปยัง Agent อื่นๆ เครื่องมือบางอย่างอาจมีฟังก์ชันเดียว หรืออาจมีฟังก์ชันที่เกี่ยวข้องหลายฟังก์ชัน

ตัวอย่างเครื่องมือ ได้แก่ เครื่องมือในตัว เช่น grep และการอ่านหรือเขียนไฟล์, เซิร์ฟเวอร์ Model Context Protocol (MCP) ในเครื่องหรือระยะไกลและฟังก์ชันที่เรียกใช้งานได้ รวมถึงการเรียก API แบบ RESTful

เครื่องมือในตัว

ในโหมด Agent, Gemini จะเข้าถึงเครื่องมือระบบในตัวได้ เลือก IDE เพื่อดูรายการเครื่องมือในตัวที่ Gemini เข้าถึงได้ในโหมด Agent

VS Code

เครื่องมือในตัวทั้งหมดของ Gemini CLI พร้อมใช้งานในโหมด Agent ใน Gemini Code Assist

IntelliJ

read_file
ดึงข้อมูลเนื้อหาข้อความของไฟล์โดยใช้เส้นทางแบบสัมบูรณ์
write_file
เขียนข้อความที่ระบุลงในไฟล์ที่ระบุ โดยสร้างไฟล์หากไม่มีอยู่
analyze_current_file
วิเคราะห์ไฟล์ที่เปิดอยู่ในเอดิเตอร์เพื่อหาข้อผิดพลาดและคำเตือน
find_files
ค้นหาเส้นทางแบบสัมบูรณ์ไปยังไฟล์โดยใช้ชื่อไฟล์หรือบางส่วนของเส้นทาง
grep
ค้นหาไฟล์ทั้งหมดภายในโปรเจ็กต์ที่มีรูปแบบข้อความหรือนิพจน์ทั่วไปที่ระบุ
list_files
แสดงรายการไฟล์และไดเรกทอรีทั้งหมดในเส้นทางแบบสัมบูรณ์ที่ระบุ
resolve_symbol
แก้ปัญหาการอ้างอิงสัญลักษณ์ที่เฉพาะเจาะจงไปยังการประกาศเดิม
find_usages
ค้นหาการอ้างอิงทั้งหมดไปยังการประกาศสัญลักษณ์ที่ระบุในโปรเจ็กต์
git
เรียกใช้คำสั่งอินเทอร์เฟซบรรทัดคำสั่ง (CLI) ของ Git และแสดงผลลัพธ์
list_vcs_roots
แสดงผลรากของระบบควบคุมเวอร์ชัน (VCS) ทั้งหมด เช่น ที่เก็บ Git ในโปรเจ็กต์ปัจจุบัน

ข้อจำกัด

ฟีเจอร์บางอย่างของ แชท Gemini Code Assist แบบมาตรฐาน อาจไม่พร้อมใช้งานในโหมด Agent หรืออาจทำงานแตกต่างจากใน แชทแบบมาตรฐาน

การท่องจำไม่พร้อมใช้งานในโหมด Agent ขณะอยู่ในโหมด Agent, Gemini จะไม่ระบุแหล่งที่มาและคุณจะ ปิดใช้คำแนะนำโค้ดที่ตรงกับแหล่งที่มาที่อ้างอิงไม่ได้

ขั้นตอนถัดไป