ภาพรวมโหมด Agent

เอกสารนี้อธิบายโหมดตัวแทนใน Gemini Code Assist

โหมดเอเจนต์พร้อมใช้งานในสภาพแวดล้อมในการพัฒนาซอฟต์แวร์แบบผสานรวม (IDE) ของ VS Code และ IntelliJ หากต้องการเริ่มใช้โหมด Agent โปรดดูใช้โหมด Agent ของ Gemini Code Assist

โหมด Agent ใน VS Code ขับเคลื่อนโดย Gemini CLI

โหมด Agent ใน IntelliJ ไม่ได้ใช้ Gemini CLI

เมื่อใช้โหมดตัวแทน คุณจะทำสิ่งต่อไปนี้และอื่นๆ ได้

  • ถามคำถามเกี่ยวกับโค้ด
  • ใช้บริบทและเครื่องมือในตัวเพื่อปรับปรุงเนื้อหาที่สร้างขึ้น
  • กำหนดค่าเซิร์ฟเวอร์ MCP เพื่อขยายความสามารถของเอเจนต์
  • รับวิธีแก้ปัญหาสำหรับงานที่ซับซ้อนซึ่งมีหลายขั้นตอน
  • สร้างโค้ดจากเอกสารการออกแบบ ปัญหา และTODOความคิดเห็น
  • ควบคุมลักษณะการทำงานของเอเจนต์โดยการแสดงความคิดเห็น แก้ไข และอนุมัติแผน และการใช้เครื่องมือในระหว่างการดำเนินการ

วิธีการทำงานของโหมดตัวแทน

ในโหมดตัวแทน ระบบจะส่งพรอมต์ของคุณไปยัง Gemini API พร้อมกับรายการเครื่องมือที่พร้อมใช้งาน Gemini API จะประมวลผลพรอมต์และแสดงคำตอบ คำตอบอาจเป็นคำตอบโดยตรง หรือคำขอให้ใช้เครื่องมือที่มีอยู่

เมื่อมีการขอใช้เครื่องมือ เจ้าหน้าที่จะเตรียมใช้เครื่องมือและตรวจสอบว่า ได้รับอนุญาตให้ใช้เครื่องมือโดยมีหรือไม่มีสิทธิ์ที่ชัดเจนหรือไม่

  • สำหรับคำขอเครื่องมือที่แก้ไขระบบไฟล์หรือดำเนินการเปลี่ยนแปลง ในทรัพยากรใดๆ Gemini จะขอให้คุณอนุญาตการดำเนินการ เว้นแต่คุณจะกำหนดค่า Gemini ให้อนุญาตเครื่องมือ หรือเครื่องมือต่างๆ เสมอ
  • คำขอเครื่องมือที่เป็นแบบอ่านอย่างเดียวอาจไม่ขอสิทธิ์ก่อนที่จะทำงานให้เสร็จ

เมื่อระบบขออนุญาตให้ใช้เครื่องมือ คุณสามารถเลือกอนุญาตหรือปฏิเสธ การดำเนินการได้ นอกจากนี้ เอเจนต์ยังอาจให้ตัวเลือกในการอนุญาตเครื่องมือหรือเซิร์ฟเวอร์เสมอ หรืออนุญาตการดำเนินการที่คล้ายกันด้วย ดูข้อมูลเพิ่มเติมได้ที่ อนุญาตการดำเนินการของเอเจนต์เสมอ

เมื่อได้รับสิทธิ์ให้ใช้เครื่องมือหรือให้สิทธิ์ด้วยตนเองแล้ว เอเจนต์จะใช้เครื่องมือเพื่อดำเนินการที่จำเป็นให้เสร็จสมบูรณ์ และระบบจะส่งผลลัพธ์ของการดำเนินการนั้นกลับไปยัง Gemini API Gemini จะประมวลผลผลลัพธ์ของ การดำเนินการเครื่องมือและสร้างคำตอบอื่น วงจรการดำเนินการและการประเมินนี้จะดำเนินต่อไปจนกว่างานจะเสร็จสมบูรณ์

สำหรับงานที่ซับซ้อน Gemini อาจแสดงแผนระดับสูงเพื่อให้คุณอนุมัติ คุณสามารถปรับแต่งแผนและถามคำถามในแชทก่อนเริ่มกระบวนการได้ เมื่อพอใจกับแผนแล้ว คุณก็อนุมัติได้ หลังจากที่คุณอนุมัติแผนแล้ว ตัวแทนจะเริ่มทำงานแรก และจะขอคำชี้แจงหรือสิทธิ์จากคุณตามที่จำเป็นขณะดำเนินการตามแผน

บริบทของโหมด Agent

บริบทช่วยให้ตัวแทนสร้างคำตอบที่ดีขึ้นสำหรับพรอมต์ที่ระบุ บริบท สามารถนำมาจากไฟล์ใน IDE, ไฟล์ในโฟลเดอร์ระบบในเครื่อง, คำตอบของเครื่องมือ และรายละเอียดพรอมต์ของคุณ

บริบทต่างๆ อาจพร้อมใช้งานสำหรับเอเจนต์ ทั้งนี้ขึ้นอยู่กับ IDE และการตั้งค่า

แท็บต่อไปนี้จะแสดงรายละเอียดวิธีรวบรวมบริบทสำหรับ IDE ต่างๆ

VS Code

โดยปกติแล้ว Gemini Code Assist ในโหมดเอเจนต์จะมีวิธีการรับบริบทต่อไปนี้

  • ข้อมูลในพื้นที่ทำงานของ IDE
  • คำตอบของเครื่องมือจากเครื่องมือในตัว เช่น grep, เทอร์มินัล, การอ่านไฟล์ หรือ การเขียนไฟล์
  • คำตอบของ Google Search
  • เนื้อหาจาก URL ที่ระบุในพรอมต์หรือโดยเครื่องมือ
  • ไฟล์บริบทที่คุณสร้างในมาร์กดาวน์

IntelliJ

โดยปกติแล้ว Gemini Code Assist ในโหมดเอเจนต์จะมีวิธีการรับบริบทต่อไปนี้

  • ข้อมูลในโปรเจ็กต์ IDE รวมถึงไฟล์ สัญลักษณ์ที่จัดทำดัชนี และการใช้สัญลักษณ์ในโปรเจ็กต์
  • คำตอบของเครื่องมือจากเครื่องมือในตัว เช่น grep, file read หรือ file write
  • การควบคุมเวอร์ชันของ IntelliJ
  • เซิร์ฟเวอร์และเครื่องมือ MCP ที่กำหนดค่าไว้
  • ไฟล์บริบทที่คุณสร้างในมาร์กดาวน์

คุณดูบริบทที่ตัวแทนใช้ได้ในลิ้นชักบริบทใน พื้นที่พรอมต์แชทโหมดตัวแทน

ลิ้นชักบริบทของโหมดตัวแทน

เครื่องมือ

เครื่องมือเป็นหมวดหมู่บริการที่กว้างซึ่งตัวแทนใช้เพื่อบริบทและ การดำเนินการในการตอบกลับพรอมต์ของคุณได้ เครื่องมือช่วยให้ตัวแทนเข้าถึงข้อมูลล่าสุด ผ่านการเรียกใช้ฟังก์ชันไปยังปลายทาง API หรือตัวแทนอื่นๆ เครื่องมือ อาจมีฟังก์ชันเดียวหรือมีฟังก์ชันที่เกี่ยวข้องหลายอย่าง

ตัวอย่างเครื่องมือบางอย่าง ได้แก่ เครื่องมือในตัว เช่น grep และการอ่านหรือเขียนไฟล์ เซิร์ฟเวอร์ Model Context Protocol (MCP) ในเครื่องหรือระยะไกลและฟังก์ชันที่เรียกใช้งานได้ รวมถึงการเรียกใช้ RESTful API

เครื่องมือในตัว

ในโหมดเอเจนต์ Gemini จะมีสิทธิ์เข้าถึงเครื่องมือระบบในตัว เลือก IDE เพื่อดูรายการเครื่องมือในตัวที่ Gemini ใช้ได้ในโหมดเอเจนต์

VS Code

เครื่องมือในตัวของ Gemini CLI ทั้งหมด พร้อมใช้งานในโหมด Agent ใน Gemini Code Assist

IntelliJ

read_file
ดึงเนื้อหาข้อความของไฟล์โดยใช้เส้นทางที่สมบูรณ์
write_file
เขียนข้อความที่ระบุลงในไฟล์ที่ระบุ และสร้างไฟล์หากไม่มี
analyze_current_file
วิเคราะห์ไฟล์ที่เปิดในเครื่องมือแก้ไขเพื่อหาข้อผิดพลาดและคำเตือน
find_files
ค้นหาเส้นทางสัมบูรณ์ไปยังไฟล์โดยระบุชื่อไฟล์หรือส่วนหนึ่งของเส้นทาง
grep
ค้นหาไฟล์ทั้งหมดภายในโปรเจ็กต์ที่มีรูปแบบข้อความหรือนิพจน์ทั่วไปที่ระบุ
list_files
แสดงรายการไฟล์และไดเรกทอรีทั้งหมดในเส้นทางแบบสัมบูรณ์ที่ระบุ
resolve_symbol
แก้ไขการอ้างอิงสัญลักษณ์ที่เฉพาะเจาะจงเป็นการประกาศเดิม
find_usages
ค้นหาการอ้างอิงทั้งหมดในการประกาศสัญลักษณ์ที่ระบุในโปรเจ็กต์
git
เรียกใช้คำสั่งอินเทอร์เฟซบรรทัดคำสั่ง (CLI) ของ Git และแสดงผลลัพธ์
list_vcs_roots
แสดงผลรูทของระบบควบคุมเวอร์ชัน (VCS) ทั้งหมด เช่น ที่เก็บข้อมูล Git ในโปรเจ็กต์ปัจจุบัน

ข้อจำกัด

ฟีเจอร์บางอย่างของแชท Gemini Code Assist มาตรฐาน อาจไม่พร้อมใช้งานในโหมดเอเจนต์หรืออาจทำงานแตกต่างจากในแชทมาตรฐาน

การท่องจำไม่พร้อมใช้งานในโหมดตัวแทน ขณะอยู่ในโหมดตัวแทน Gemini จะไม่อ้างอิงแหล่งที่มา และคุณจะปิดใช้คำแนะนำโค้ดที่ตรงกับแหล่งที่มาที่อ้างอิงไม่ได้

ขั้นตอนถัดไป