数据驱动 AI:JetBrains 邀您共建智能开发未来

9/30/2025, 11:52:06 AM

📌 一句话摘要

JetBrains 邀请用户分享代码数据,助力 AI 工具升级。我们重视透明度、隐私与用户控制。

📝 详细摘要

这篇来自 JetBrains 的文章提出了人工智能开发中的一个关键挑战:公共数据集难以满足复杂、真实的专业编码环境需求。文章强调,虽然人工智能已经取得了显著进展,但其输出质量在处理复杂的任务时会下降,导致错误和幻觉。为了克服这个问题,JetBrains 建议收集用户在使用集成开发环境 (IDE) 时的代码相关数据,包括编辑历史、终端使用情况、代码片段和 AI 交互等。该公司声称,这种真实世界的数据对于检测不安全代码、高效处理低智能任务以及改进代码补全等功能至关重要,从而确保人工智能真正理解专业工作流程。JetBrains 强调对用户隐私的坚定承诺,详细说明数据共享是自愿的,符合欧盟数据保护法,受到保护,并且仅限于授权人员用于产品改进,而不会与第三方共享。JetBrains 还开源了专门为代码补全构建的大语言模型 (LLM) Mellum,以回馈开发者社区。针对公司(管理员控制,提供免费许可证)、非商业个人用户(默认选择加入,易于选择退出)和其他个人许可证(通过设置选择加入)概述了不同的选择加入/选择退出机制。这些变更将在 2025.2.4 集成开发环境 (IDE) 更新中正式推出,期待您的参与,共同打造更智能、更安全、更实用的 AI 工具。

💡 主要观点

  1. 真实专业开发数据对于提升人工智能模型性能至关重要,可有效弥补公共数据集的不足。 当前的人工智能工具在复杂的编码场景中表现不佳,因为它们是在通用的公共数据上训练的,导致错误,并且缺乏对专业工作流程的理解。真实世界的使用数据对于改进至关重要。
  2. JetBrains 正在请求详细的代码相关数据,以显著增强其人工智能工具。 共享编辑历史、代码片段和人工智能交互等数据,将帮助 JetBrains 开发出能够检测不安全代码、高效处理日常任务的人工智能。此外,还能提供为专业开发者量身定制的更智能的代码补全和解释功能。
  3. 用户数据共享是自愿的、透明的,并受到严格的隐私保护。 JetBrains 向用户保证,数据收集是可选的,符合欧盟数据法,受到保护,并且仅用于产品改进。用户可以随时完全控制选择加入或选择退出。

💬 文章金句

📊 文章信息

AI 评分:87
来源:The JetBrains Blog
作者:Kris Kang
分类:人工智能
语言:英文
阅读时间:7 分钟
字数:1520
标签: 人工智能开发, 数据收集, JetBrains, 开发者工具, 大语言模型训练
阅读完整文章

阅读原文 QR Code 返回目录