ĐẠI CẨM NANG HERMES AGENT
“Từ một người mù mờ công nghệ đến người làm chủ trợ lý AI toàn năng. Giải phóng 80% thời gian làm việc vặt mỗi ngày.”
NỘI DUNG CHÍNH
Lời Tựa: Kỷ nguyên mới của công việc
Bạn đang đọc một bài viết có thể làm thay đổi hoàn toàn cách bạn làm việc và tận hưởng cuộc sống. Mỗi ngày, chúng ta đều có 24 giờ. Nhưng hãy thử nhẩm tính xem bạn đã dành bao nhiêu thời gian cho những việc “không tên”? Sắp xếp lịch họp, trả lời những email rập khuôn, copy dữ liệu từ file Excel này sang file Excel khác, tìm kiếm giá vé máy bay rẻ nhất, hay vật lộn với việc quản lý hóa đơn chi tiêu.
Khi ChatGPT ra đời, mọi người tung hô nó như một phép màu. Đúng, nó có thể viết một bài thơ trong 3 giây. Nhưng bạn vẫn phải mở máy tính lên, copy đề bài đưa cho nó, rồi lại tự tay copy kết quả đem đi dán chỗ khác. Nó thông minh, nhưng nó bị liệt. Nó không có chân tay để hành động thay bạn.
Sự ra đời của AI Agent (Đại lý/Trợ lý tự trị)
Hermes Agent, phát triển bởi Nous Research, không phải là một phần mềm bạn bật lên để hỏi đáp. Nó là một thực thể sống ảo chạy ngầm 24/7. Bạn giao cho nó mục tiêu: “Tôi muốn biết giá vàng mỗi sáng, và nếu giá giảm 5% hãy gửi báo cáo vào email cho tôi”. Bạn có thể tắt máy tính đi du lịch. Hermes sẽ tự động mở trình duyệt, phân tích, và gửi email.
Bài viết này được viết dài, rất dài. Vì tôi muốn nắm tay bạn đi từ những bước chập chững nhất, cập nhật những công nghệ đột phá nhất của năm 2026, nhưng lại không dùng từ ngữ chuyên môn hack não. Hãy pha một tách trà và bắt đầu hành trình xây dựng “đế chế” trợ lý ảo của riêng bạn.
Lịch sử AI & Cái chết của Chatbot
Để hiểu tại sao Hermes lại là một bước ngoặt, chúng ta cần hiểu nhanh về cách AI đã tiến hóa.
Giai đoạn 1: AI “Cầm Tay Chỉ Việc”
Hãy nhớ lại những con Bot tự động trên Fanpage Facebook cách đây vài năm. Bạn bấm phím “1”, nó hiện ra menu. Gõ sai, nó ngu ngơ. Đây là AI chạy bằng “If – Then” (Nếu – Thì).
Giai đoạn 2: AI “Bách Khoa Toàn Thư” (Chatbot tĩnh)
ChatGPT hay Claude tạo nên cơn địa chấn. Nhưng điểm yếu chí mạng là sự mất trí nhớ và sự thụ động. Bạn không hỏi, nó không trả lời. Đóng tab web lại, nó quên sạch bạn là ai.
Giai đoạn 3: Kỷ nguyên AI Agent tự trị & Có trạng thái (Stateful)
Hermes thuộc giai đoạn 3. Người ta lấy “bộ não” cực kỳ thông minh của mô hình ngôn ngữ lớn (LLM), lắp cho nó một “đồng hồ” (để chạy định kỳ), một “ổ cứng” lưu trí nhớ vĩnh viễn (nhờ cơ sở dữ liệu SQLite FTS5), và “bàn tay” để nó tự bấm chuột, lướt web, gửi mail.
Giải phẫu bộ não Hermes (Cập nhật cơ chế Tự Học)
Khác biệt lớn nhất của Hermes Agent so với các đối thủ như OpenClaw hay Claude Code là kiến trúc 5 thành phần có khả năng tiến hóa.
1. Động cơ (LLM)
Hermes hỗ trợ kết nối đa dạng. Bạn có thể lắp não xịn (GPT-4o, Claude 3.5 Sonnet) hoặc dùng mô hình chạy mạng nội bộ (Ollama, vLLM với Llama 3.3, Qwen) để bảo mật 100% dữ liệu công ty.
2. Trí nhớ Đa Tầng
Hệ thống phân tầng siêu việt: USER.md (nhớ thói quen của bạn), MEMORY.md (nhớ tiến độ dự án) và SOUL.md (định hình nhân cách, giúp AI không bị “nịnh bợ” hay thay đổi giọng điệu giữa chừng).
3. Vòng lặp Tự Cải Tiến
Đây là tính năng vô giá: Nếu Hermes làm một tác vụ phức tạp thành công (ví dụ: tìm lỗi code mất 5 bước), nó sẽ tự động kích hoạt “pha phản tư”, đúc kết thành một tài liệu kỹ năng (Skill) lưu lại. Lần sau làm việc tương tự, tốc độ xử lý nhanh hơn 40%!
4. Bảo bối (Tools & MCP)
Các công cụ có sẵn (tìm web, thao tác file). Mới nhất là chuẩn MCP (Model Context Protocol) giúp Hermes kết nối với hàng ngàn phần mềm bên ngoài một cách chuẩn hóa.
5. Lịch trình tự động (Cron Jobs)
Biến AI thành thực thể sống. Lệnh: “Mỗi Chủ Nhật lúc 20:00, hãy vào app chi tiêu và gửi báo cáo phân tích qua Telegram”. Nó sẽ tự động làm mãi mãi mà không cần bạn bật app.
Quy tắc an toàn (Hệ thống Sandbox)
DỪNG LẠI! Trước khi giao quyền cho AI, hãy nhớ AI là một thanh gươm sắc.
Do Hermes có khả năng can thiệp trực tiếp vào file máy tính và trình duyệt, hệ thống được thiết kế với 5 cấp độ phê duyệt (Approval Modes):
*Lưu ý: Đối với môi trường doanh nghiệp, Hermes sẽ chạy trong các container Docker bị cách ly hoàn toàn, không thể phá hỏng hệ điều hành chính của máy chủ.
Xây nhà cho AI: App Desktop vs VPS
Tin vui lớn nhất năm 2026: Bạn không cần phải làm “hacker gõ màn hình đen” nữa. Hermes cung cấp 2 phương thức tùy theo nhu cầu của bạn:
Hermes Desktop App (v0.15.2)
Giao diện đẹp mắt như Slack hay Discord. Cài đặt file .exe hoặc .dmg vào máy tính cá nhân là dùng ngay.
- Có bảng điều khiển trực quan để xem AI đang suy nghĩ gì.
- Duyệt file và quản lý trí nhớ (Memory) không cần sửa code.
- Nhược điểm: Khi bạn tắt máy tính, AI đi ngủ. Không phù hợp làm tác vụ ngầm 24/7.
Đám mây VPS & “The Kitchen”
Thuê máy chủ ảo (Hetzner, Hostinger) giá từ $4-$6/tháng để AI chạy ngầm không ngừng nghỉ.
- Dùng lệnh để cài đặt nhanh gọn (Tích hợp công cụ
uvsiêu tốc). - Kết nối qua Telegram/Discord để ra lệnh bằng điện thoại ở bất cứ đâu.
- Sử dụng giao diện web “The Kitchen” qua mạng nội bộ Tailscale để điều khiển trên di động an toàn tuyệt đối.
Cấp thêm tay mắt: Máy tính, Giọng nói & MCP
Năm 2026, AI không chỉ còn là xử lý văn bản. Hãy “trang bị vũ khí” cho Hermes bằng 3 công nghệ sau:
Giao thức MCP & Composio
Để AI đọc được Gmail, tạo lịch Google Calendar hay cập nhật Notion, bạn sử dụng chuẩn kết nối MCP thông qua thư viện Composio.
Chỉ cần khai báo API Key vào file config.yaml (hoặc nhập trên app Desktop), Hermes sẽ tự động hiểu cách gọi hàng ngàn ứng dụng bên thứ 3.
Thao tác màn hình trực tiếp (Computer Use)
Độc quyền trên macOS: Cấp quyền Trợ năng (Accessibility) và Ghi màn hình, Hermes có khả năng tự di chuột, cuộn trang, và gõ phím trực tiếp vào các app vật lý (như TradingView, TextEdit) y hệt con người. Bạn có thể ngồi nhìn con trỏ chuột tự chạy làm việc!
Gọi thoại trực tiếp (Voice Mode)
Sử dụng lệnh /voice join, Hermes sẽ tham gia ngay vào kênh thoại Discord của bạn. Nó nghe bạn nói (chuyển âm thành văn bản STT) và trả lời bằng giọng người thật (TTS qua ElevenLabs hoặc Edge TTS miễn phí) với độ trễ siêu thấp.
Nghệ thuật viết lệnh (Prompting) & Lệnh hệ thống
Với Hermes, bạn không chỉ chat, bạn đang điều khiển hệ thống. Hãy sử dụng các lệnh tắt (Slash commands) siêu việt qua Telegram/Discord:
/model [tên_mô_hình]: Chuyển đổi não (từ GPT-4 sang Claude) nóng giữa trận mà không cần khởi động lại./personality [tên]: Đổi ngay phong cách (ví dụ: từ “nghiêm túc” sang “cợt nhả”)./background [việc]: Ném việc cho AI chạy ngầm để luồng chat chính không bị kẹt./rollback [số]: Cỗ máy thời gian, phục hồi file/bộ nhớ về trạng thái trước đó nếu AI lỡ làm sai.
Công thức giao việc CTCO
C – Context (Bối cảnh)
“Tôi là một trader đang cần tin tức…”
T – Task (Nhiệm vụ)
“…Hãy mở web tài chính, tìm tin về giá vàng…”
C – Constraints (Ràng buộc)
“…Tuyệt đối bỏ qua tin về chứng khoán…”
O – Output (Đầu ra)
“…Báo cáo thành bảng 2 cột gửi qua Slack.”
Thư viện Kịch bản thực tế (Copy & Paste)
#1: Thư ký báo cáo buổi sáng (Lệnh chạy ngầm)
#2: Máy quét tài liệu & Lưu trữ (Tự động hóa Web)
#3: Gọi điện thoại báo động (Voice Mode)
#4: Trợ lý Thao tác Máy tính (Computer Use – macOS)
Chi phí vận hành & Gỡ lỗi
Bài toán Kinh tế: Lợi ích của “Vòng lặp tự cải tiến”
Khác với trả tiền SaaS theo tháng giới hạn tính năng, nuôi Hermes trên VPS (giá từ $6 – $11/tháng cho gói cơ bản) và trả tiền token LLM (khoảng $2 – $5/tháng nếu dùng DeepSeek Flash) là một khoản đầu tư sinh lời.
Lý do: Nhờ cơ chế tự đúc kết kỹ năng (skills/), sau khoảng 3 tuần chạy liên tục các việc lặp lại, Hermes sẽ tối ưu hóa đường dẫn suy nghĩ, giúp giảm trung bình 30% lượng token tiêu thụ cho cùng một khối lượng công việc!
Gỡ lỗi nhanh
Lỗi: Không chạy được quyền hệ thống
Do tính năng bảo vệ Allowlist. Mở file approvals.yaml ra và thêm câu lệnh bạn muốn cho phép vào danh sách trắng, hoặc chỉnh tạm sang chế độ interactive / ask để nó hỏi bạn trước khi chạy.
Lỗi: AI đổi tính đổi nết
Đó là hiện tượng Tone Drift (Trôi giọng điệu). Cách fix: Cập nhật file SOUL.md, thiết lập các quy tắc “chống nịnh bợ” (anti-sycophancy) để ép AI giữ nguyên thái độ chuyên nghiệp, hoài nghi khoa học suốt phiên hội thoại dài.
Phụ Lục: Tổng Hợp Tài Liệu Hermes Agent
Bảng này tổng hợp các tài liệu dạng ebook, PDF, long-form guide và tài liệu chính thức liên quan đến việc học và sử dụng Hermes Agent.
Gợi ý đọc nhanh
- Nếu mới bắt đầu: đọc Quickstart Tutorial và Installation Guide.
- Nếu muốn tài liệu dạng ebook/PDF: tải Hermes Agent Orange Book bản English PDF.
- Nếu muốn tra cứu toàn bộ: dùng Hermes Agent — Full Documentation (
llms-full.txt). - Nếu muốn học automation: đọc Automate with Cron, Work with Skills, Team Telegram Assistant, Use MCP with Hermes.
Ghi chú
- Tài liệu chính thức mới nhất là website docs của Hermes Agent: hermes-agent.nousresearch.com/docs/
- Chưa thấy PDF/EPUB chính thức từ Nous Research; PDF đáng chú ý nhất hiện là Orange Book trên GitHub.
- Một số bài bên thứ ba có thể bị thay đổi hoặc cần đăng nhập/paywall tùy thời điểm truy cập.
- 6 ứng dụng của trí tuệ nhân tạo trong kinh doanh giúp tăng lợi nhuận
- 5 Công cụ kiểm tra AI tốt nhất giáo viên cần chú ý
- AI Đổi Mới Doanh Nghiệp
- [Tool Dùng Online] AI Automation – Tender / Bidding Hunter: Giải Pháp “Săn” Gói Thầu & Soi Giá Đối Thủ B2B Tự Động
- Bảo vệ: AI đa năng viết bài Social (Văn bản + Hình ảnh + Video)



