GitHub本月最佳:使用电脑的新方式 ,已经获得3万7千星

搜索
AI-TNT
正文
资源拓展
GitHub本月最佳:使用电脑的新方式 ,已经获得3万7千星
2024-01-16 14:40

我们用鼠标来使用电脑,这种方式成就了世界首富,改变了世界


但是,电脑仍旧不能自动帮我们做事情,电脑仍旧“听不懂人话”


Open Interpreter 允许LLM在您的计算机上运行代码来完成任务。


这可能是人类使用电脑的新方式,一句人话,电脑开始帮人类完成任务


比如你告诉电脑:把浏览器历史缓存清理一下……


比如你告诉电脑:太卡了,把不用的进程关闭一下……


比如你告诉电脑:画一幅图,起个名字,存在D盘

……


github地址

https://github.com/KillianLucas/open-interpreter


国内镜像

http://www.gitpp.com/microsoft/open-interpreter-cn


github上已经获得3万7千星


GitHub本月最佳:使用电脑的新方式 ,已经获得3万7千星


Open Interpreter(开放解释器) 可以让大语言模型(LLMs)在本地运行代码(比如 Python、JavaScript、Shell 等)。安装后,在终端上运行 $ interpreter 即可通过类似 ChatGPT 的界面与 Open Interpreter 聊天。


本软件为计算机的通用功能提供了一个自然语言界面,比如:


  • 创建和编辑照片、视频、PDF 等
  • 控制 Chrome 浏览器进行搜索
  • 绘制、清理和分析大型数据集
  • ...

⚠️ 注意:在代码运行前都会要求您批准执行代码。


大型语言模型(如大型预言模型LLM)的出现可以被视为一场科技革命,它们正在彻底改变我们与计算机交互的方式。Open Interpreter(开放解释器)就是利用这种先进的语言模型,通过人类语言来指导电脑执行各种任务。


这种交互方式的优点是显而易见的:


1. 更自然和直观的交互:与传统的图形用户界面(GUI)相比,使用语言与电脑交互更为直观和自然。人们习惯于用语言交流,因此这种新的交互方式更符合人类的习惯。


2. 提高效率:对于一些复杂的任务,用语言描述可能比用鼠标和键盘更为高效。特别是对于那些需要多个步骤或者复杂逻辑的任务,语言指令可以让电脑更快地理解并执行。


3. 普及和技术下沉:随着技术的进步,语言模型有可能被整合进更多的设备和平台,使得更多的人能够享受到这种先进的交互方式,甚至有可能使得一些原本需要专业技能的操作变得大众化。


4. 改善可访问性:对于一些有物理障碍或者不习惯使用传统电脑界面的用户,语言交互方式可以提供更大的便利。


然而,这种新的交互方式也带来了挑战,包括对隐私的保护、语言的歧义性处理、以及如何确保电脑真正理解并正确执行人类的指令等。但无论如何,开放解释器和大型语言模型的出现,无疑为我们与电脑的交互方式带来了新的可能性和机遇。


GitHub本月最佳:使用电脑的新方式 ,已经获得3万7千星


快速开始


pip install open-interpreter


终端

安装后,运行 interpreter

interpreter


Python

from interpreter import interpreter

interpreter.chat("Plot AAPL and META's normalized stock prices") # 执行单一命令
interpreter.chat() # 开始交互式聊天


与 ChatGPT 的代码解释器比较


OpenAI 发布的 Code Interpreter 和 GPT-4 提供了一个与 ChatGPT 完成实际任务的绝佳机会。


但是,OpenAI 的服务是托管的,闭源的,并且受到严格限制:


  • 无法访问互联网。

  • 预装软件包数量有限。

  • 允许的最大上传为 100 MB,且最大运行时间限制为 120.0 秒

  • 当运行环境中途结束时,之前的状态会被清除(包括任何生成的文件或链接)。

Open Interpreter(开放解释器)通过在本地环境中运行克服了这些限制。它可以完全访问互联网,不受运行时间或是文件大小的限制,也可以使用任何软件包或库。


它将 GPT-4 代码解释器的强大功能与本地开发环境的灵活性相结合。


命令


交互式聊天


要在终端中开始交互式聊天,从命令行运行 interpreter


interpreter


或者从.py 文件中运行 interpreter.chat()


interpreter.chat()


程序化聊天


为了更精确的控制,您可以通过 .chat(message) 直接传递消息 :


interpreter.chat("Add subtitles to all videos in /videos.")

# ... Streams output to your terminal, completes task ...

interpreter.chat("These look great but can you make the subtitles bigger?")

# ...


开始新的聊天


在 Python 中,Open Interpreter 会记录历史对话。如果你想从头开始,可以进行重置:


interpreter.messages = []


保存和恢复聊天


messages = interpreter.chat("My name is Killian.") # 保存消息到 'messages'
interpreter.messages = [] # 重置解释器 ("Killian" 将被遗忘)

interpreter.messages = messages # 从 'messages' 恢复聊天 ("Killian" 将被记住)


自定义系统消息


你可以检查和配置 Open Interpreter 的系统信息,以扩展其功能、修改权限或赋予其更多上下文。


interpreter.system_message += """
使用 -y 运行 shell 命令,这样用户就不必确认它们。
"""
print(interpreter.system_message)


更改模型


Open Interpreter 使用LiteLLM连接到语言模型。


您可以通过设置模型参数来更改模型:


interpreter --model gpt-3.5-turbo
interpreter --model claude-2
interpreter --model command-nightly


在 Python 环境下,您需要手动设置模型:


interpreter.llm.model = "gpt-3.5-turbo"


在本地运行 Open Interpreter(开放解释器)


interpreter --local


调试模式


为了帮助贡献者检查和调试 Open Interpreter,--verbose 模式提供了详细的日志。


您可以使用 interpreter --verbose 来激活调试模式,或者直接在终端输入:


$ interpreter
...
> %verbose true <- 开启调试模式

> %verbose false <- 关闭调试模式


安全提示


由于生成的代码是在本地环境中运行的,因此会与文件和系统设置发生交互,从而可能导致本地数据丢失或安全风险等意想不到的结果。


⚠️ 所以在执行任何代码之前,Open Interpreter 都会询问用户是否运行。


您可以运行 interpreter -y 或设置 interpreter.auto_run = True 来绕过此确认,此时:


  • 在运行请求修改本地文件或系统设置的命令时要谨慎。

  • 请像驾驶自动驾驶汽车一直握着方向盘一样留意 Open Interpreter,并随时做好通过关闭终端来结束进程的准备。

  • 考虑在 Google Colab 或 Replit 等受限环境中运行 Open Interpreter 的主要原因是这些环境更加独立,从而降低执行任意代码导致出现问题的风险。

它是如何工作的?


Open Interpreter 为函数调用语言模型配备了 exec() 函数,该函数接受 编程语言(如 "Python "或 "JavaScript")和要运行的 代码


然后,它会将模型的信息、代码和系统的输出以 Markdown 的形式流式传输到终端。

 

大语言模型的出现确实是一场技术革命,它对我们的生活和工作可能会带来以下几个方面的变革:


1. 交互方式的转变:如前所述,大语言模型使得人类能够通过自然语言与电脑交互,这将大大简化操作流程,提高效率。例如,语音助手、聊天机器人等将更加智能,能够理解更复杂的指令和查询。


2. 信息获取和处理:大语言模型可以快速生成文本、回答问题、提供解释,这将改变我们获取和处理信息的方式。例如,在教育、新闻、客户服务等领域,语言模型可以提供即时的、个性化的信息。


3. 工作流程的优化:在许多行业,例如法律、医疗、编程等,大语言模型可以帮助专业人士更快地完成文档编写、数据分析、代码调试等任务,提高工作效率。


4. 创意产业的变革:语言模型可以用于创作文本、音乐、艺术作品等,为创意产业带来新的创作方式和灵感来源。


5. 教育和培训:大语言模型可以作为教育工具,提供个性化的学习体验,帮助学生通过对话和交互式学习来提高理解和记忆。


6. 语言服务和翻译:语言模型可以大大提高机器翻译的质量和速度,使得跨语言交流更加容易,对国际贸易、文化交流等有着重要影响。


7. 社会影响的重新分配:随着语言模型在各个领域的应用,可能会出现新的职业和工作机会,同时也会对某些职业造成冲击,如重复性强的文书工作可能会被自动化。


8. 伦理和法律问题:语言模型的广泛应用也带来了隐私保护、版权、责任归属等伦理和法律问题,需要社会各界共同探讨和解决。


总之,大语言模型的出现将对社会产生深远的影响,它既为我们的生活和工作带来了巨大的便利,也提出了新的挑战和问题。我们需要在享受技术带来的好处的同时,也要关注和应对它可能带来的负面影响。


这可能是人类使用电脑的新方式,一句人话,电脑开始帮人类完成任务


比如你告诉电脑: 把浏览器历史缓存清理一下……


比如你告诉电脑:太卡了,把不用的进程关闭一下……


比如你告诉电脑:画一幅图,起个名字,存在D盘

……


github地址

https://github.com/KillianLucas/open-interpreter


国内镜像

http://www.gitpp.com/microsoft/open-interpreter-cn


文章来自于微信公众号 “GitHubTop网站”,作者 “ gitpp.com


GitHub本月最佳:使用电脑的新方式 ,已经获得3万7千星

1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

IOS下载
安卓下载
微信群
沪ICP备2023015588号