Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124


根据需要使用 Gemini。通过共享您的窗口,您可以根据所看到的内容获得即时、针对具体情况的支持。

当您处理项目或任务时,可以使用简单的全局快捷键(Option+空格)快速启动 Gemini。

无需解释,让我们立即开始使用。您可以根据共享窗口中文档、代码和数据的状态获取答案。


从使用 Nano Banana 创建图像到使用 Veo 生成视频,只需单击一下即可使用强大的创意套件。它可以处理任何任务。

在 Mac 上使用 Gemini 的各项功能,您可以更高效地进行头脑风暴和信息收集,而不会中断您的工作。快速找到答案,继续前进。
下载地址 https://gemini.google/mac
谷歌一直坚信,人工智能有潜力让信息和计算更易于获取,并造福于民。我们率先在大规模语言模型 (LLM) 领域取得了突破性进展,并持续在谷歌及更广泛的领域内推进这项技术的发展。多年来,谷歌一直在后台应用 LLM 来改进众多产品,例如Gmail 中的预测文本、增强的谷歌翻译以及提升谷歌搜索的查询理解能力。我们将继续在众多谷歌服务中使用 LLM,并增强Gemini 应用,为用户提供由生成式人工智能驱动的功能。Gemini 应用是一款特殊的应用程序,让您能够亲身体验谷歌最新的人工智能模型。我们致力于将其打造成为最用户友好、最个性化的 AI 助手。
生成式人工智能作为一项具有改变世界潜力的技术,正吸引着人们的广泛关注,但它仍处于发展初期。本文概述了谷歌开发 Gemini 应用(以下简称“Gemini”)的方法,该应用可在移动设备和网页上使用(包括 Gemini 的定义、工作原理、当前功能和局限性等)。随着 Gemini 底层技术的不断发展,以及谷歌从研究、经验和用户反馈中不断学习,Gemini 的开发方法也将随之演进。
Gemini 是一个多模态语言生成模型 (LLM) 界面,用于处理文本、语音、图像等多种数据。Gemini 基于谷歌前沿的 LLM 研究,该研究始于 2013 年发表的一篇关于Word2Vec 的论文,该论文提出了一种将词语映射到数学概念的全新模型架构。随后,在 2015 年,谷歌推出了神经对话模型。该框架阐明了模型如何根据前一句预测对话中的下一句,从而确保对话自然流畅。此外, 2017 年Transformer的突破以及2020 年多轮聊天功能的推出,都展现了生成式语言模型领域的显著进步。
秉承其人工智能理念,谷歌于2023年3月首次发布了Gemini(当时名为Bard)试点项目。自那时起,Gemini已被用于各种任务,从撰写电子邮件、调试复杂的代码问题到集思广益地构思活动创意、理解晦涩的概念。如今,Gemini作为一款功能全面的人工智能工具,在诸多方面为用户提供支持,增强创造力、生产力和好奇心,并将持续添加新功能和创新技术。
Gemini 可以帮助您简化工作流程。例如,如果您想快速了解一份冗长的研究文档,可以将其上传到 Gemini,它会提供清晰简洁的摘要。此外,它还提供代码支持,这项功能正迅速成为其最受欢迎的用途之一。
Gemini还能帮助用户将想法变为现实,激发创造力。例如,如果用户正在撰写博客文章,Gemini可以提供一个大致的框架,并生成与文章内容相匹配的图片。此外,即将推出的Gem功能将允许用户向Gemini发出自定义指令,使其能够作为特定领域的专家(SME)协助用户实现个人目标。
Gemini 有潜力进一步激发用户的好奇心,引导他们探索感兴趣的想法和主题。例如,它可以简化复杂的主题,并根据主题和图像呈现相关的分析数据。此外,一项将这些分析数据与推荐网页内容相结合的功能也即将推出,以帮助用户深入了解特定主题。
Gemini 正在快速发展,不久后它将推出一项新功能,只需将智能手机摄像头对准物体即可获取信息。例如,如果您对街上看到的某种植物感到好奇,只需用智能手机对准它,即可向 Gemini 查询相关信息。它还可以用其他语言解释餐厅菜单,并根据您的喜好推荐菜肴。这些只是 Gemini 未来将要推出的众多新功能中的一部分。
谷歌对Gemini进行严格的训练和监控,以提高其答案的可靠性并满足用户期望。我们还通过与行业专家、教育工作者、政策制定者、商业领袖、民权领袖和内容创作者的讨论,探索这项不断发展的技术的新用途、风险和局限性。
Gemini只是谷歌持续致力于负责任的LLM(生命周期管理)开发的一部分。在此过程中,谷歌已经识别并探讨了与LLM相关的若干限制因素。以下是谷歌正在持续研究的六个关键领域。
谷歌将继续探索新的方法来提高这些领域的性能。
Gemini 基于谷歌独有的“信息组织技术”,经过训练能够生成与用户提示语境高度相关且符合用户意图的答案。然而,与所有语言学习模型一样,Gemini 也可能自信且令人信服地呈现包含不准确或误导性信息的答案。
由于 LLM 的工作原理是通过预测下一个单词或短语,因此它目前还无法完全独立区分信息的准确性。Gemini 曾出现过生成包含不准确信息的答案,甚至生成错误信息的情况(例如,错误地描述其训练方式或列出不存在的书籍名称)。谷歌开发了一项名为“双重验证”的功能来解决这个问题。该功能允许用户在谷歌搜索中找到有助于评估 Gemini 答案的内容,并查看支持 Gemini 输出信息的来源链接。
训练数据(包括来自公开渠道的数据)反映了各种不同的观点和看法。谷歌正在研究如何利用这些数据,将广泛的观点纳入LLM的响应中,同时最大限度地减少不准确的过度概括和偏见。
当模型尝试预测提示的合理答案时,训练数据中的不足、偏差和过度概括会反映在输出结果中。这些问题可能以多种方式表现出来(例如,答案仅考虑特定文化或用户群体,提及存在问题的过度概括,包括性别、宗教或种族偏见,或者仅呈现单一视角)。在某些主题中,数据可能不足;也就是说,可能没有足够的可靠信息供语言学习模型 (LLM) 学习并就特定主题做出高质量的预测。这可能导致答案质量低下或不准确。谷歌与这些领域的专家和不同的社群合作,以利用谷歌以外的先进专业知识。
对于主观性较强的话题,除非用户明确要求,否则 Gemini 旨在为用户提供多种视角。例如,如果用户询问一些无法通过一手资料或可靠来源的事实来验证的问题(例如主观评价“最佳”或“最差”),Gemini 应该提供一个反映多种观点的答案。然而,由于像 Gemini 这样的逻辑推理模型(LLM)是基于互联网上的公开内容进行训练的,它们可能会反映出对某些公众人物(例如政治家或名人)的正面或负面看法,或者只采纳某个具有争议性的社会或政治问题的某一方观点。Gemini 不应该提供支持此类话题特定观点的答案。谷歌会利用用户对这类答案的反馈来训练 Gemini,使其能够做出更恰当的回应。
由于 Gemini 经过训练,能够用日常语言反映人类体验,因此它有时会生成听起来像是带有你个人观点或情感(例如爱或悲伤)的回复。谷歌制定了 Gemini 如何展现自身形象(角色)的指导原则,并不断改进模型以提供客观的回复。
谷歌制定了一套政策指南,旨在帮助训练 Gemini 并防止其生成有问题的答案。然而,Gemini 可能会误解这些指南,导致出现“误报”和“漏报”。“误报”是指 Gemini 错误地认为某个提示不恰当,从而未能对有效的提示做出响应。“漏报”是指尽管有指南存在,Gemini 仍然生成了不恰当的答案。误报和漏报的出现可能会让用户觉得 Gemini 存在偏见。例如,误报可能导致 Gemini 无法回答关于某个问题某一方面的问题,却能回答关于同一问题另一方面的问题。谷歌不断完善其模型,加深对输入和输出的理解,并对其进行分类,因为语言、事件和社会都在快速变化。
部分用户可能会尝试挑战 Gemini 的功能极限或突破其防御机制,例如试图泄露训练协议或其他信息,或试图绕过安全机制。谷歌已对 Gemini 进行了严格的测试,并将继续进行测试,但我们也意识到用户可能会找到独特而复杂的方法来使 Gemini 过载。这对于改进 Gemini 至关重要。谷歌致力于学习用户可能提出的新问题。事实上,自 2023 年 Gemini 发布以来,用户已经向其提出了各种各样的问题,从哲学问题到无厘头问题,不一而足。作为回应,Gemini 可能会给出同样无厘头的答案,或者给出与上述方法不符的答案。如何让 Gemini 正确应对此类问题是一个持续的挑战,谷歌正在通过扩大内部评估和红队测试来提高其准确性、客观性和细致程度。
除了人工智能原则之外,谷歌最近还明确了其与 Gemini 合作的方式。具体而言,它指出:“遵循用户指令,根据用户需求进行定制,并确保安全使用。” 这种方式的核心在于对责任和安全的重视。Gemini 的政策指南旨在避免某些问题输出。谷歌将通过内部“红队”(由产品专家和社会科学家组成,他们专门对模型进行压力测试,以检查其是否符合政策指南和谷歌关于 Gemini 的指导)成员进行的对抗性测试,不断改进 Gemini。
在开发 Gemini 时,隐私也是一个至关重要的考虑因素。如需了解更多关于 Gemini 如何以隐私设计和用户控制为核心进行开发的信息,请参阅Gemini 应用的隐私中心。
Google 提供多种管理工具,方便用户查看、更新、管理、导出和删除其 Gemini 数据。用户可以访问和查看 Gemini 提示和回复,并通过 Gemini 应用的活动管理界面提供反馈。他们还可以关闭 Gemini 应用的活动设置,以防止其与 Gemini 的聊天记录被用于改进 Google 的机器学习技术。与其他 Google 服务一样,用户也可以使用 Google 的数据导出工具下载和导出信息。此外,用户还可以设置管理为 Gemini 对话创建的公开链接,并启用或禁用对扩展程序(例如 Google Workspace、Google Maps 和 YouTube)的访问权限。Google 将继续探索让用户能够更精细地控制其 Gemini 回复的新方法,包括调整筛选条件以启用更广泛的回复输出。
谷歌面向发布商推出了Google-Extended 功能。该功能允许网站发布商管理是否允许其网站内容用于改进 Gemini 和Vertex AI生成 API。通过允许 Google-Extended 访问您网站的内容,您可以帮助 AI 模型随着时间的推移提高其准确性和功能。Gemini 将不会使用已选择退出的 URL 中的内容,也不会将此类内容用于基准测试。随着 AI 应用的不断扩展,网站发布商管理各种用途的任务可能会变得更加复杂。谷歌正与网络和 AI 社区合作,探索以更易于机器理解的方式提供选择和控制选项。