<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>RAG on 赛博工具站</title>
    <link>https://haodaohang.top/tags/rag/</link>
    <description>Recent content in RAG on 赛博工具站</description>
    <image>
      <title>赛博工具站</title>
      <url>https://haodaohang.top/images/cover.png</url>
      <link>https://haodaohang.top/images/cover.png</link>
    </image>
    <generator>Hugo -- 0.152.2</generator>
    <language>zh-cn</language>
    <lastBuildDate>Sun, 29 Mar 2026 10:00:00 +0800</lastBuildDate>
    <atom:link href="https://haodaohang.top/tags/rag/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Onyx评测：开源AI平台让企业知识秒变智能助手</title>
      <link>https://haodaohang.top/posts/2026-03-29-onyx-ai-platform-review/</link>
      <pubDate>Sun, 29 Mar 2026 10:00:00 +0800</pubDate>
      <guid>https://haodaohang.top/posts/2026-03-29-onyx-ai-platform-review/</guid>
      <description>&lt;h2 id=&#34;简介&#34;&gt;简介&lt;/h2&gt;
&lt;p&gt;Onyx是个开源的AI聊天平台，支持OpenAI、Claude、Gemini这些主流LLM。核心功能就是把企业内部知识喂给AI——上传文档、连上Slack和Confluence，然后AI就能基于这些内容回答问题。简单说就是私有版的ChatGPT，但它真的读过你公司的资料。&lt;/p&gt;
&lt;p&gt;GitHub上热度不错，号称1000+团队在用。我测了一圈，感觉确实不是PPT产品。&lt;/p&gt;
&lt;h2 id=&#34;核心功能&#34;&gt;核心功能&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;RAG检索：混合搜索加知识图谱，文档或连接器里的内容都能挖出来&lt;/li&gt;
&lt;li&gt;自定义Agent：给AI设定角色和知识范围，造个专属客服或研究员&lt;/li&gt;
&lt;li&gt;深度研究模式：多步搜索，适合要翻很多资料的问题&lt;/li&gt;
&lt;li&gt;代码解释器：跑Python代码，做数据分析画图&lt;/li&gt;
&lt;li&gt;网页搜索：接了Google PSE、Exa、Serper，能实时搜网&lt;/li&gt;
&lt;li&gt;40+连接器：Slack、Notion、Google Drive、Confluence这些主流工具都能连&lt;/li&gt;
&lt;li&gt;MCP协议：AI不只是聊天，还能调API干活&lt;/li&gt;
&lt;li&gt;企业安全：SSO、权限控制、文档权限继承、凭据加密&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;价格方案&#34;&gt;价格方案&lt;/h2&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;方案&lt;/th&gt;
          &lt;th&gt;价格&lt;/th&gt;
          &lt;th&gt;说明&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;社区版 (CE)&lt;/td&gt;
          &lt;td&gt;免费&lt;/td&gt;
          &lt;td&gt;MIT开源，自己部署，核心功能全有&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;商业版&lt;/td&gt;
          &lt;td&gt;联系销售&lt;/td&gt;
          &lt;td&gt;团队用，全部功能&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;企业版 (EE)&lt;/td&gt;
          &lt;td&gt;联系销售&lt;/td&gt;
          &lt;td&gt;私有部署、SSO、白标、企业SLA&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;社区版免费开源，自托管不花钱。商业版和企业版需要找他们销售聊，官网没公开价格。&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;💡 个人或小团队先试云端版，确认好用再考虑自托管
&lt;a href=&#34;%E9%93%BE%E6%8E%A5&#34;&gt;CPS链接：Onyx官网 →&lt;/a&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h2 id=&#34;优缺点对比&#34;&gt;优缺点对比&lt;/h2&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;优点&lt;/th&gt;
          &lt;th&gt;缺点&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;开源免费，数据在自己手里&lt;/td&gt;
          &lt;td&gt;自托管要懂点运维&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;连接器多，主流工具都能接&lt;/td&gt;
          &lt;td&gt;企业版价格要谈，不够透明&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;RAG效果确实比ChatGPT强&lt;/td&gt;
          &lt;td&gt;文档还在完善中&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;支持所有主流LLM&lt;/td&gt;
          &lt;td&gt;功能多，上手有门槛&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;过了SOC 2 Type II和GDPR&lt;/td&gt;
          &lt;td&gt;云端版海外部署，国内访问可能慢&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;适合人群&#34;&gt;适合人群&lt;/h2&gt;
&lt;p&gt;&lt;strong&gt;推荐：&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;公司有大量内部文档、需要AI帮忙查&lt;/li&gt;
&lt;li&gt;对数据安全敏感、想自托管&lt;/li&gt;
&lt;li&gt;已经在用Slack/Notion/Confluence的团队&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;不推荐：&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;个人用户——功能太多用不上&lt;/li&gt;
&lt;li&gt;没技术运维能力的——要么用云端版，要么找人托管&lt;/li&gt;
&lt;li&gt;只想简单聊天的——直接用ChatGPT/Claude更省事&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;使用教程&#34;&gt;使用教程&lt;/h2&gt;
&lt;ol&gt;
&lt;li&gt;先试云端版：&lt;a href=&#34;https://cloud.onyx.app&#34;&gt;cloud.onyx.app&lt;/a&gt; 注册就能用&lt;/li&gt;
&lt;li&gt;自托管一键装：&lt;code&gt;curl -fsSL https://onyx.app/install_onyx.sh | bash&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;填LLM的API密钥：OpenAI、Claude、Gemini都行&lt;/li&gt;
&lt;li&gt;接知识源：选需要连的应用授权&lt;/li&gt;
&lt;li&gt;开始用：上传文档或连上应用后就能问问题了&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id=&#34;购买建议&#34;&gt;购买建议&lt;/h2&gt;
&lt;p&gt;如果你公司内部知识多、又想控制数据，Onyx值得花时间搭。社区版免费且功能完整，自托管成本低。&lt;/p&gt;</description>
    </item>
    <item>
      <title>百万上下文时代来临：Claude 1M全面开放，定价战争终局？</title>
      <link>https://haodaohang.top/posts/2026-03-16-claude-1m-context/</link>
      <pubDate>Mon, 16 Mar 2026 10:00:00 +0800</pubDate>
      <guid>https://haodaohang.top/posts/2026-03-16-claude-1m-context/</guid>
      <description>Anthropic宣布Claude的1M token上下文窗口全面开放，且按标准定价无溢价。这意味着处理100万token的成本与处理1万token相同。这场&amp;#39;长文本战争&amp;#39;可能迎来终局——RAG架构会被颠覆吗？</description>
    </item>
    <item>
      <title>RAG 技术栈「内卷」终结？OpenRAG 用一站式方案降低落地门槛</title>
      <link>https://haodaohang.top/posts/2026-03-13-openrag-all-in-one/</link>
      <pubDate>Fri, 13 Mar 2026 16:00:00 +0800</pubDate>
      <guid>https://haodaohang.top/posts/2026-03-13-openrag-all-in-one/</guid>
      <description>langflow-ai 推出的 OpenRAG 整合了 Langflow、Docling 和 OpenSearch，提供了开箱即用的 RAG 平台。本文评测其功能特性、部署体验，并与 LlamaIndex、LangChain 等方案对比。</description>
    </item>
    <item>
      <title>AI Agent 不再健忘：Hindsight 如何让智能体像人一样积累经验</title>
      <link>https://haodaohang.top/posts/2026-03-13-hindsight-agent-memory/</link>
      <pubDate>Fri, 13 Mar 2026 12:00:00 +0800</pubDate>
      <guid>https://haodaohang.top/posts/2026-03-13-hindsight-agent-memory/</guid>
      <description>vectorize.io 开源的 Hindsight 项目解决了 Agent 的最大痛点——无状态。通过向量检索和记忆压缩技术，让智能体拥有持续学习和经验积累的能力</description>
    </item>
    <item>
      <title>Gemini Embedding 2：谷歌首款原生多模态嵌入模型深度解读</title>
      <link>https://haodaohang.top/posts/2026-03-12-gemini-embedding-multimodal/</link>
      <pubDate>Thu, 12 Mar 2026 16:00:00 +0800</pubDate>
      <guid>https://haodaohang.top/posts/2026-03-12-gemini-embedding-multimodal/</guid>
      <description>谷歌推出业界首款原生多模态嵌入模型 Gemini Embedding 2，支持文本、图像、视频、音频及文档的统一向量表示，开启跨模态语义理解新纪元</description>
    </item>
  </channel>
</rss>
