Purple Llama

在这里插入图片描述

文章目录

    • 一、关于 Purple Llama
      • 为什么是紫色的?
      • 许可证
    • 二、评估和基准
    • 三、系统级保障
    • 四、入门


一、关于 Purple Llama

Purple Llama 是一个伞式项目,随着时间的推移,它将汇集工具和评估,帮助社区用开放的生成人工智能模型负责任地构建。最初的版本将包括网络安全和输入/输出保护的工具和评估,但我们计划在不久的将来做出更多贡献。

  • github : https://github.com/meta-llama/PurpleLlama
  • 官方文档:https://llama.meta.com/docs/get-started/
  • 🤗 Models on Hugging Face : https://huggingface.co/meta-Llama
  • Blog : https://ai.meta.com/blog/purple-llama-open-trust-safety-generative-ai
  • Website : https://ai.meta.com/llama/purple-llama
  • CyberSec Eval Paper : https://ai.meta.com/research/publications/purple-llama-cyberseceval-a-benchmark-for-evaluating-the-cybersecurity-risks-of-large-language-models/
  • Llama Guard Paper : https://ai.meta.com/research/publications/llama-guard-llm-based-input-output-safeguard-for-human-ai-conversations/

为什么是紫色的?

借用一个 概念 : https://www.youtube.com/watch?v=ab_Fdp6FVDI

从 我们相信,要真正缓解网络安全领域的挑战 生成式AI呈现,我们需要同时采取进攻(红队)和防守 (蓝队)姿势。紫队,由红队和蓝队组成 责任,是一种评估和缓解的协作方法 潜在风险和同样的精神适用于生成性人工智能,因此我们的 对Purple Llama 的投资将是全面的。


许可证

Purple Llama 项目中的组件将获得许可,允许研究和商业使用。我们相信这是朝着实现社区协作和标准化生成性人工智能开发的信任和安全工具的开发和使用迈出的重要一步。更具体的评估和基准是根据麻省理工学院许可证获得许可的,而任何模型都使用Llama 2社区许可证。见下表:

组件类型组件许可证
发放/基准测试Cyber Security Eval(其他即将到来)MIT
模型Llama GuardLlama 2社区许可证
模型Llama Guard 2Llama 3社区许可证
保障Code Shield麻省理工学院

二、评估和基准


Cybersecurity_45">Cybersecurity


CyberSec Eval 1

我们认为CyberSec Eval v1是LLM的第一套全行业网络安全评估。这些基准基于行业指南和标准(例如CWE和MITRE ATT&CK),并与我们的安全主题专家合作构建。我们旨在提供工具,帮助解决白宫关于发展负责任人工智能的承诺 中概述的一些风险,包括:

  • 量化LLM网络安全风险的指标。
  • 评估不安全代码建议频率的工具。
  • 评估LLM的工具,使生成恶意代码或帮助实施网络攻击变得更加困难。

我们相信这些工具将减少LLM建议不安全的人工智能生成代码的频率,并降低它们对网络对手的帮助。我们的初步结果表明,LLM存在有意义的网络安全风险,包括推荐不安全的代码和遵守恶意请求。有关更多详细信息,请参阅我们的 Cybersec Eval paper。


CyberSec Eval 2

CyberSec Eval 2 通过测量LLM滥用代码解释器的倾向、攻击性网络安全能力和对即时注入的敏感性来扩展其前身。你可以在这里阅读论文。

你也可以在这里 查看🤗排行榜。


三、系统级保障

正如我们在Llama 3中概述的那样 负责任使用指南,我们 建议检查和过滤LLM的所有输入和输出 根据适用于应用程序的内容指南。


Llama Guard

为了支持这一点,并赋予社区权力,我们发布了Llama Guard,这是一个公开可用的模型,它在常见的开放基准上具有竞争力,并为开发人员提供预训练模型来帮助抵御潜在的风险输出。作为我们对开放透明科学的持续承诺的一部分,我们还在Llama Guard论文中发布了我们的方法论和模型性能的扩展讨论。

我们很高兴分享一个更新的版本,元Llama Guard 2。Llama Guard 2进行了优化,以支持MLCommons新宣布的政策,将其覆盖范围扩大到更全面的开箱即用安全类别。

它还具有比Llama Guard 1更好的分类性能和改进的零射击和少射击适应性。

最终,我们的愿景是使开发人员能够自定义此模型以支持相关用例,并更容易采用最佳实践并改进开放生态系统。


Code Shield

Code Shield增加了对LLM生成的不安全代码的推理时间过滤的支持。Code Shield提供了减轻不安全代码建议风险、防止代码解释器滥用和安全命令执行的功能。CodeShield示例笔记本。


四、入门

要开始并学习如何在Llama 模型中使用Purple Llama 组件, 请参阅 https://ai.meta.com/llama/get-started/ 的入门指南。 该指南提供了帮助您设置Llama 的信息和资源,包括 如何访问模型、托管操作信息和集成指南。此外, 您将找到补充材料以进一步帮助您,同时负责任地 用Llama 建造。该指南将更新为更多Purple Llama 组件 被释放。


2024-07-16(二)


http://www.niftyadmin.cn/n/5557985.html

相关文章

Go语言中GC(垃圾回收回收机制)三色标记与混合写屏障

5、Golang三色标记混合写屏障GC模式全分析 (yuque.com) 第1讲-课程目标_哔哩哔哩_bilibili Golang三色标记GC混合写屏障 Go V1.3之前的标记清除(mark and sweep) 垃圾回收、内存管理、自动适放、三色标记法、STW (stop the world) 图的遍历?可达性分…

69、Flink 的 DataStream Connector 之 Kafka 连接器详解

1.概述 Flink 提供了 Kafka 连接器使用精确一次(Exactly-once)的语义在 Kafka topic 中读取和写入数据。 目前还没有 Flink 1.19 可用的连接器。 2.Kafka Source a)使用方法 Kafka Source 提供了构建类来创建 KafkaSource 的实例。以下代…

大语言模型系列 - Transformer:从基础原理到应用

文章目录 大语言模型系列 - Transformer:从基础原理到应用一、Transformer简介二、Transformer的基础原理自注意力机制多头注意力机制位置编码残差连接和层归一化 三、Transformer的架构编码器解码器 四、Transformer的应用场景机器翻译文本生成文本分类问答系统 五…

arm的GIC中断

一、gic V2 ①、中断状态: gic为每个中断维护着4个状态,inactive、pending、active、active and pending The following states apply at each interface between the GIC and a connected processor: Inactive: An interrupt that is not active or…

解锁Mac与Windows无缝协作新纪元:Tuxera NTFS for Mac 2022 —— 高效读写,畅享双系统自由

Tuxera NTFS for Mac 2022,作为一款专为Mac用户设计的文件系统驱动插件,它彻底打破了Mac与Windows之间在文件读写上的界限,为用户带来了前所未有的跨平台体验。 这款插件让Mac用户能够轻松访问、读取并写入NTFS格式的硬盘或U盘,无…

怎么录屏?Windows和Mac电脑都适用的3种方法

在数字化时代的浪潮中,电脑录屏已经成为一种必备技能。无论是为了制作教学视频,记录游戏的高光时刻、还是为了保存下欢乐时光,录屏功能都在我们当中发挥着重要的作用。但是怎么录屏也成为一个难题,有时候用的电脑不一样&#xff0…

HCNA VRP文件系统

前言 华为网络设备设备的配置文件和VRP系统文件都保存在物理存储介质中,所以文件系统是VRP正常运行的基础。只有掌握了对文件系统的基础操作,网络工程师才能对设备的配置文件和VRP系统文件进行高效的管理。 文件管理 [Huawei]dis version Huawei Vers…

2024最新超详细SpringMvc常用注解总结

SpringMVC常用注解 控制器(Controller)相关注解: 1.Controller Controller 注解用于标识一个类为 Spring MVC 的控制器,它能够处理用户的请求并返回相应的视图或数据。通常与 RequestMapping 注解一起使用,以定义请求…