บทนำ
ในยุคดิจิทัลที่ AI Agent กำลังกลายเป็นเทคโนโลยีสำคัญที่เปลี่ยนแปลงวิธีที่เราทำงานและสื่อสาร การสร้าง AI Agent ที่สามารถรับรู้ภาพ เสียง และคิดวิเคราะห์ได้เองโดยไม่ต้องเขียนโค้ด กำลังเป็นที่สนใจของหลายคน ไม่ว่าคุณจะเป็นมือใหม่หรือผู้เชี่ยวชาญด้าน AI บทความนี้จะแนะนำวิธีการสร้าง AI Agent ที่สามารถ มองเห็น พูด และคิด ได้ โดยใช้ N8N แพลตฟอร์มที่ช่วยให้คุณทำสิ่งเหล่านี้ได้โดยไม่ต้องมีทักษะการเขียนโปรแกรม
ในคู่มือนี้เราจะสร้าง AI Agent ที่สามารถ:
- อ่านข้อความและตอบกลับ ผ่าน Telegram
- วิเคราะห์และเข้าใจเสียง แล้วตอบกลับด้วยเสียง
- วิเคราะห์รูปภาพ และให้คำตอบที่เกี่ยวข้อง
- เข้าถึงอีเมลและจัดการปฏิทิน เช่น อ่านและส่งอีเมล หรือสร้างกิจกรรมใน Google Calendar
- ค้นหาข้อมูลออนไลน์ และสรุปข่าวสารจากแหล่งข้อมูลต่างๆ
- ใช้ฐานข้อมูลเวกเตอร์ เพื่อจัดเก็บและดึงข้อมูลที่เกี่ยวข้อง
มาดูกันว่าเราจะสร้าง AI Agent นี้ได้อย่างไร!
การตั้งค่าแพลตฟอร์ม N8N
1. สมัครใช้งานและตั้งค่า N8N
N8N เป็นแพลตฟอร์มเวิร์กโฟลว์อัตโนมัติที่ช่วยให้เราสร้าง AI Agent ได้ง่ายโดยไม่ต้องเขียนโค้ด คุณสามารถเลือกติดตั้ง N8N บนเซิร์ฟเวอร์ของคุณเอง หรือใช้บริการ N8N Cloud เพื่อความสะดวก
- สมัครใช้งานที่ N8N.io
- สร้างบัญชีและเข้าสู่ระบบ
- ตั้งค่าแดชบอร์ดให้พร้อมใช้งาน
สร้าง AI Agent ที่พูดและฟังได้
2. เชื่อมต่อ AI Agent กับ Telegram
Telegram เป็นแพลตฟอร์มที่ง่ายต่อการผสาน AI Agent ของเราเข้าด้วยกัน เราจะใช้ Telegram Bot API เพื่อให้ AI สามารถรับและส่งข้อความได้
ขั้นตอนการตั้งค่า
- ไปที่ BotFather บน Telegram และพิมพ์
/newbot - ตั้งชื่อบอทและกำหนด username (ต้องลงท้ายด้วย
bot) - คัดลอก API Token ที่ได้รับมา
- ไปที่ N8N และเพิ่ม Telegram Trigger Node
- ใส่ API Token ที่ได้รับจาก BotFather
3. ตั้งค่า AI ให้ตอบกลับข้อความ
เราจะใช้ OpenAI GPT-4o เพื่อทำให้ AI ของเราสามารถวิเคราะห์และตอบกลับข้อความได้
- เพิ่ม AI Agent Node ใน N8N
- เลือก Chat Model: GPT-4o
- กำหนด System Prompt ให้ AI เข้าใจบทบาท เช่น:
คุณเป็นผู้ช่วยที่เป็นมิตรและช่วยเหลือชื่อ Sammy ให้คำตอบสั้นและตรงประเด็น
4. รองรับการสนทนาด้วยเสียง
AI Agent ของเราจะสามารถรับข้อความเสียงจาก Telegram และทำการแปลงเสียงเป็นข้อความ (Transcribe) โดยใช้ OpenAI Whisper API
- ใช้ Telegram Get File Node เพื่อดาวน์โหลดไฟล์เสียง
- ใช้ OpenAI Transcribe Node เพื่อแปลงเสียงเป็นข้อความ
- ส่งข้อความที่แปลงแล้วให้ AI Agent วิเคราะห์และตอบกลับ
- หากต้องการให้ AI ตอบกลับด้วยเสียง ใช้ OpenAI Generate Audio Node
เพิ่มความสามารถให้ AI วิเคราะห์รูปภาพ
5. การวิเคราะห์และทำความเข้าใจรูปภาพ
AI ของเราจะสามารถวิเคราะห์รูปภาพและตอบคำถามเกี่ยวกับเนื้อหาของรูปภาพได้โดยใช้ GPT-4o Vision API
กระบวนการทำงาน
- ใช้ Telegram Trigger Node เพื่อตรวจสอบว่าผู้ใช้ส่งรูปภาพหรือไม่
- ดาวน์โหลดรูปภาพโดยใช้ Telegram Get File Node
- ส่งรูปภาพไปให้ OpenAI Image Analysis API
- ให้ AI ตอบกลับด้วยคำอธิบายหรือวิเคราะห์เนื้อหาของรูปภาพ
ให้ AI Agent จัดการอีเมลและปฏิทิน
6. อ่านและส่งอีเมลผ่าน Gmail
เราจะให้ AI อ่านอีเมลที่ยังไม่ได้อ่านและสามารถส่งอีเมลแทนเราได้โดยใช้ Gmail API
การตั้งค่า
- ไปที่ Google Cloud Console
- เปิดใช้งาน Gmail API
- ตั้งค่า OAuth Consent Screen
- รับ Client ID และ Client Secret
- เชื่อมต่อ Gmail API กับ N8N
ตัวอย่างการใช้งาน
- คำสั่ง:
"สรุปอีเมลที่ยังไม่ได้อ่านของฉัน" - AI จะดึงข้อมูลอีเมลที่ยังไม่ได้อ่านและสรุปให้ฟัง
- หากต้องการส่งอีเมล:
"ส่งอีเมลถึง John ถามว่าเขาสนใจเล่นสควอชวันเสาร์ไหม"
7. จัดการ Google Calendar
AI Agent จะสามารถสร้างและดึงข้อมูลกิจกรรมในปฏิทินของเราได้โดยใช้ Google Calendar API
ตัวอย่างการใช้งาน
- คำสั่ง:
"ฉันมีประชุมอะไรบ้างวันนี้?" - คำสั่ง:
"สร้างอีเวนต์ 'ประชุมทีม' วันที่ 5 ก.ค. เวลา 10.00 น."
ให้ AI ค้นคว้าข้อมูลออนไลน์
8. ค้นหาข้อมูลและสรุปข่าวสาร
AI ของเราจะสามารถค้นหาข้อมูลจาก Google และสรุปผลลัพธ์ให้เราได้โดยใช้ SERP API
ตัวอย่างการใช้งาน
- คำสั่ง:
"มีข่าว AI ล่าสุดอะไรบ้าง?" - AI จะทำการค้นหาบน Google และสรุปข่าวล่าสุดให้เรา
เพิ่มฐานความรู้ให้ AI
9. ใช้ฐานข้อมูลเวกเตอร์เพื่อดึงข้อมูล
เราจะสร้างฐานข้อมูลเวกเตอร์โดยใช้ Pinecone เพื่อให้ AI สามารถดึงข้อมูลที่เกี่ยวข้องได้ เช่น รายชื่อผู้ติดต่อ พร้อมกับอีเมลของพวกเขา
การตั้งค่า
- สมัครใช้งาน Pinecone.io
- สร้างอินเด็กซ์ใหม่
- ใช้ N8N เพื่อโหลดข้อมูล CSV ที่มีรายชื่อติดต่อเข้าไปในฐานข้อมูล
- ให้ AI Agent ใช้ Pinecone API ค้นหาข้อมูลที่เกี่ยวข้องเมื่อจำเป็น
ตัวอย่างการใช้งาน
"ส่งอีเมลถึง Alice ถามว่าเธอว่างทานข้าวเย็นวันศุกร์ไหม"- AI จะค้นหาที่อยู่อีเมลของ Alice จากฐานข้อมูลและส่งอีเมลให้โดยอัตโนมัติ
สรุป
เราได้สร้าง AI Agent ที่สามารถรับรู้ วิเคราะห์ และโต้ตอบได้ โดยไม่ต้องเขียนโค้ด! ด้วยการใช้ N8N, OpenAI GPT-4o, Whisper, Vision API, Google APIs และ Pinecone เราสามารถทำให้ AI Agent ของเรามีความสามารถหลากหลาย เช่น:

✅ พูดคุยและฟังเสียง
✅ วิเคราะห์รูปภาพ
✅ อ่านและส่งอีเมล
✅ จัดการปฏิทิน
✅ ค้นหาข้อมูลออนไลน์
✅ ใช้ฐานข้อมูลเวกเตอร์
ในปี 2025 AI Agent จะกลายเป็นเครื่องมือสำคัญ และการเรียนรู้วิธีสร้างมันตั้งแต่วันนี้จะทำให้คุณก้าวนำหน้าทางเทคโนโลยี!
หากคุณสนใจพัฒนา AI Agent เพิ่มเติม ลองสำรวจ N8N และดูว่าคุณสามารถขยายความสามารถของมันไปได้ไกลแค่ไหน 🚀
📍 ติดตามเนื้อหาเพิ่มเติม ที่เรานำมาฝากได้ ที่นี่
อัปเดตความรู้เรื่อง AI และเทคนิคการทำงานให้คุณทุกสัปดาห์! ได้ที่ learn.prompt-expert.co



