公司新闻

OB欧宝大模型工具箱、ChatGPT 上架 App Store、微软 Bing 更新

  大模型工具箱、ChatGPT 上架 App Store、微软 Bing 更新

  站在2023 年5月末的时间点,过去 6 个月大模型相关领域的变化非常快,对于我这样既是大模型相关领域的观察者、记录者,同时也是大模型应用的使用者来说,如何利用这次技术发展带来的工具与流程创新,进一步升级并迭代自己的工作流程,显得尤为重要。

  此前的几期会员通讯,我从不同角度、零星分享过一些工具使用思考,本期的「流程」专栏,我会结合自己的实践,全面梳理和总结日常工作、生活中使用的大模型相关应用。洞察·流程开箱我的大模型工具箱

  与过往历次人工智能热潮相比,此次以 ChatGPT 为代表的新一轮 AI 热潮对于个体——特别是白领工作者——的影响极其深远,随着大模型技术落地速度的加快,个人生产力工具、流程也在发生深刻变化,越来越多的应用开始「利用新方法解决旧问题」,同时也出现了一些「新方法解决新需求」的实践和案例。

  站在 2023 年 5 月末的时间点,过去 6 个月大模型相关领域的变化非常快,对于我这样既是大模型相关领域的观察者、记录者,同时也是大模型应用的使用者来说,如何利用这次技术发展带来的工具与流程创新,进一步升级并迭代自己的工作流程,显得尤为重要。

  此前的几期会员通讯,我从不同角度、零星分享过一些工具使用思考,本期的「流程」专栏,我会结合自己的实践,全面梳理和总结日常工作、生活中使用的大OB欧宝体育官网模型相关应用,或许可以给各位提供一些灵感。

  ChatGPT 无疑是最具「开箱即用」特质的大模型应用,免费用户即可通过网页、移动应用(目前仅限 iOS)与 ChatGPT 直接对话,借助 Plus 服务,用户还可以获得诸如 GPT-4、第三方插件的能力,推荐几个值得尝试的插件:

  · WebPilot:用户输入一个链接后,该插件可实时读取网页内容,支持内容摘要生成等特性;

  ·Show Me:可根据用户输入的概念,生成一系列相关示意图,能够帮助用户更好理解某个概念;

  ·Likewise:侧重娱乐和媒体推荐,比如我会询问当下的畅销书排名和书评;

  ·AITickerChat:如果你经常需要获取美国上市公司的财报、分析师电话会议等资料,这个插件很有用;

  ·Video Insights:可分析用户输入的视频链接(不限 Youtube),然后生成视频内容摘要;

  考虑到 ChatGPT 现在的注册门槛——比如注册 IP、IP 所在地的移动电话号码——越来越高,Poe 也是一款不错的「开箱即用」类产品,仅需一个邮箱即可完成注册使用。Poe 的免费版本提供了不限量的 ChatGPT、Claude Instant 对话功能,但我更推荐其付费版本里的 Claude+ 和 Claude-instant-100k 两个模型服务:

  ·Claude+:能够提供可媲美 GPT-4 的语言理解和处理能力,而且还能处理比 GPT—4 更多的文本请求,比如我会把 4000 左右的汉字文本交给 Claude+「阅读并理解」,GPT-4 则显示文本太多无法处理;

  ·Claude-instant-100k:这可能是目前公开可访问的最强文本处理机器人,一个对线 万汉字);

  不过需要注意的是,Poe 每个模型每次只能处理单一对话,因此,为了更好借助上下文的能力,我建议各位最好在每一次交互(完全)完成之后再开启新的对话,这样得到的效果更好;更何况,Poe 的一些模型,比如 GPT-4 每月有固定(高速)额度,需要「珍惜」。

  「开箱即用」的服务足够简单,但也受限于场景、交互界面,在一些时候并不方便。比如,如果我在阅读某个网页的时候需要 ChatGPT 的翻译能力,那么我必须要经历「复制网页内容——粘贴到 ChatGPT 输入框并输入提示词——等待翻译」这样冗长的过程。此时,如果可以借助浏览器插件,直接调取 ChatGPT 或其他模型的翻译能力,让我在不离开网页的情况下看到译文,无疑非常方便。

  这也是目前很多基于 OpenAI/Claude API 第三方工具的出发点。这些大模型的 API 与上面提到的「开箱即用」产品不同,大模型的 API 面向开发人员,需要借助一些工具才能实现相应的功能,回到我的网页翻译场景里,我可以把大模型的 API Key(通常是一组类似「sk-xxxx」的字符)粘贴到浏览器翻译插件里,然后由翻译插件调用大模型的翻译能力,实现直接翻译。

  ·OpenAI:免费 API 申请很简单,但付费(特别是绑定支付方式)非常困难;

  另外还有一些开发者通过合法或不合法的渠道,重新封装各类免费或付费 API 之后提供一个新 API,这里不做过多推荐。

  基于大模型的 API,我们可以「拥有」更多大模型应用,以翻译为例,下面这组浏览器插件值得尝试:

  ·沉浸式翻译:横跨全平台,拥有网页翻译、图书翻译(制作双语对照图书)的能力,实测使用 OpenAI API 将一本 75 万字符的英文图书翻译成中文,大概需要 1.2 美元(不到 10 元人民币);

  ·划词翻译:可绑定多个 OpenAI API Key,还能和各类词典实现协同;

  ChatGPTBox是另一款值得推荐的浏览器插件,它的有趣之处在于集成了众多模型服务,从 OpenAI 的各类模型到 Claude 甚至微软 Bing 无所不包,甚至还能加入自定义模型。

  · 网页处于打开状态,比如打开 ChatGPT 或 Poe 网页,这样才能调取这两个服务里的模型;

  配置之后,我在任意网页选中一段话,即可通过右键调取 ChatGPTBox 窗口开启对话,支持「翻译」、「内容总结」等场景,所有这些对话记录也会同步到各自帐号的对话历史里:

  更进一步,基于大模型的 API,这款OpenCat为 iPhone 用户提供扩展键盘服务,如下图所示,OpenCat 可读取内容编辑界面的信息(中间图片),搭配用户自定义或导入的提示词,可快速调取大模型的能力,从而生成相应的内容(最右侧图):

  OpenCat 是目前 iOS 上最具实用价值的大模型相关应用,通过键盘扩展,将大模型的能力延伸到几乎任何一个应用里,同时开发者还提供了微软 TTS 接入功能,你可以把微软 Azure 上优秀的文本转语音能力集成进来,让 AI 帮你读出内容。

  从「开箱即用」的产品到基于 API 的自定义场景应用,大语言模型改变了过往众多生产力应用的使用流程,让用户真正感受到 AI 带来的巨大价值。

  但也需要看到几个潜在问题,比如很多基于 API 的应用的定位与功能类似,建议各位以宁缺勿滥的心态挑选、使用这些应用。

  其次,本文提到的任何一个产品以及所有标榜大模型的产品都需要网络,这意味着,「离线」成了使用大模型的最大门槛,如果你的网络条件比较差或者经常在飞机机舱这样的场合,大模型应用带来的可能不是效率提升,而是一种无奈。

  第三,也是我认为最重要的一点,请务必关注数据隐私和安全。特别是在使用非官方提供的大模型 API 的时候,不要提及个人私密数据(比如密码或银行账户)和一些中文敏感词汇,同时尽量不要使用网络上「好心」网友分享出来的大额度免费 OpenAI API。

  最后的最后,随着大模型相关领域的继续发展,我相信我的这个工具箱还会持续迭代,也欢迎各位朋友通过回复这封邮件,分享您的大模型工具箱。

  其次,用户在 iOS 上的对话记录也会同步到网页上,目前 iOS 上的应用还不支持插件,不过如果用户的对话是在网页上通过插件发起,手机上可以继续使用,下图展示了我在手机上继续使用 WebPilot 读取网页:

  对于绝大多数想去体验 ChatGPT 的中国用户来说,这款应用带来的最大「好处」是可以直接通过 App Store 内购的方式订阅 ChatGPT Plus,价格和网页版一样,不过需要几点:

  ·ChatGPT 应用已经在 App Store 美区上架,其他地区也在逐步覆盖中,请尽量在美区 App Store 购买;

  ·关于美区 Apple ID 的注册,可参考这篇教程以及下面的一些评论补充,比起折腾 OpenAI 的支付方式实在是简单多了;

  ·美区 Apple ID 可通过绑定 Paypal 进行支付(和信用卡无异),现阶段 Paypal 注册时需要美区(实体)手机号,如果你的手机支持 eSim 卡,推荐使用Tello推出的 5 美元/月的套餐,每月拥有 100分钟 Wi-Fi Calling 通话、无限短信收发权益;

  目前,ChatGPT 应用已经成为美区 App Store 的推荐应用,并且在「免费效率」类应用排名第一。而根据 OpenAI 的说法,Android 版本的 ChatGPT 应用也会很快发布。

  ·随着「正版」ChatGPT 推出原生应用,那些在 App Store 上的虚假甚至带有诈骗性质的所谓「ChatGPT 应用」会不会被苹果制裁?

  ·ChatGPT 在手机上的流行,是否将进一步冲击苹果和 Google 在移动设备语音交互的产品布局?或者说,苹果和 Google 会如何应对?

  微软 Bing 更新,支持 iOS/Android 桌面小组件(下图是 iPhone 上的小组件)、多端对话同步等功能。

  「多端对话同步」功能可以帮助用户将桌面端的对话记录同步到手机上操作,预计本周内会推送到 iOS 和 Android 用户手里。

  另外,微软还展示了将 Bing 搜索与 Edge 浏览器整合在一起的效果,有两个应用场景:

  ·通过 Edge 浏览网页时,直接点按 Bing 图标即可快速总结网页内容,并支持后续的对话交互;

  上述两个功能也会在近期向 iOS 和 Android 用户开放,我也会持续关注。

  Google Drive 近期有两个实用更新,首先是 Google Drive 增加了一个类似邮件「垃圾邮件箱」的「垃圾文件箱」功能,这在一些共享文件比较多的场景里非常合适,与判断垃圾邮件一样,Google Drive 也有一套算法检测用户接收到的文件是否是「垃圾文件」,然后自动将其归入其中。

  第二个更新是 Google Doc 支持了标题折叠(仅限在 Web),用户(文档作者)可以默认设置标题折叠还是展开,而当文档分享给其他用户并被修改的时候,文档作者的设置不会受到影响。

  这个功能对于经常编辑篇幅较长、内容结构复杂的用户来说是一个巨大帮助,预计很快将向所有使用 Google Doc 的用户推送。

  ·稍后读应用 Pocket 更新:移动版本进一步优化「主页」显示,便于用户更好找到自己感兴趣的内容,Web 版本则增加了「自建阅读列表」的功能,你可以通过这篇博客了解此次 Pocket 的更新情况;

  ·iOS 开源输入法「仓输入法」更新:新增的「应用备份与恢复」和「单手模式」非常实用,你可以通过App Store免费下载这款输入法;

  ·应用 Poe 发布 Android 版本:不过目前用户还不能直接通过 Android 里的内购进行升级,建议需要的朋友首先在网页版购买高级套餐,然后在 Android 设备上登录同一个账户,你可通过Play Store免费下载体验这款产品;

  苹果发布了首份 App Store透明度报告,详细介绍了 2022 年苹果应用商店的应用审核、下架情况,几个关键数字:

  ·大约有 168 万款应用被拒绝,报告详细列出了拒绝的原因,其中超过 100 万款应用是由于性能问题而被拒绝;

  苹果上周发布 iOS/iPadOS 16.5,修复了大量安全层面的 Bug,涵盖内核、Siri 快捷指令、相册、Webkit 等多个组件或应用,非常建议各位更新。

  距离 WWDC 还有两周时间,MR 设备的发布或展示已经箭在弦上,Bloomberg 记者 Mark Gurman 汇总了一份苹果内部直接或间接推进 MR 产品的高管名单。