ypx-社区专栏-作者主页-天翼云开发者社区

全部文章Ta的评论

大模型红蓝对抗技术介绍
大模型红蓝对抗技术是评估和增强LLMs安全性和鲁棒性的一种重要方法，旨在发现和缓解模型可能产生的有害、不准确或存在偏见的内容。红队和蓝队是网络安全领域常用的概念，可以引申到人工智能安全中。红队扮演攻击者的角se，主动寻找系统的漏洞和弱点。蓝队则扮演防御者的角se，负责构建和jiaqiang防御机制，提升模型的鲁棒性和安全性。
安全专区 AI 安全
ypx
2025-06-19
10
0
模型内生安全调研
模型内生安全调研
安全
ypx
2025-05-28
21
1
多专家提示提高了大型语言模型的可靠性、安全性和实用性
《Multi-expert Prompting Improves Reliability, Safety and Usefulness of Large Language Models》阅读分享
AI
ypx
2025-02-10
9
0
Rule Based Rewards for Language Model Safety 阅读
Rule Based Rewards for Language Model Safety 阅读分享
AI
ypx
2025-02-10
23
0
prompt写作技巧&结构化模版示例
prompt写作技巧&结构化模版示例
AI 安全
ypx
2024-10-11
69
1
Qwen2.5技术报告解读
Qwen2.5技术报告解读
AI 安全安全专区
ypx
2024-10-11
1020
1
AI Safety in Generative AI Large Language Models
《AI Safety in Generative AI Large Language Models: A Survey》论文解读分享
AI 安全
ypx
2024-08-08
32
1
LVLM攻击综述论文阅读分享
《A Survey of Attacks on Large Vision - Language Models: Resources, Advances, and Future Trends》论文阅读报告分享
安全
ypx
2024-07-17
106
1

共 8 条前往

页

没有更多了

个人简介

暂未填写公司和职务

暂未填写个人简介

暂未填写技能专长

暂未填写毕业院校和专业

个人成就

共发表过 8 篇文章

文章获得 5 次赞同

文章被浏览 1290 次

获得 1 人关注

个人荣誉查看规则

有目共赏

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

活动

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云