id
type
5
status
21
review version
0
cleanup version
0
pending deletion
0
created at
2025-05-19 02:52:55
updated at
2025-11-27 11:22:24
url
https://sreake.com/blog/llm_hacker_gpt/
url length
39
url crc
3764
url crc32
1372982964
location type
1
canonical status
10
canonical page id
domain id
domain tld
0
domain parts
0
originating warc id
-
originating url
https://sreake.com/post-sitemap.xml
source type
1
page id
title
Webサイトを自律攻撃するLLMのロジックを考えた | sreake.com | 株式会社スリーシェイク
excerpt
content
目次 目次 はじめにLLMによるハッキングの先行事例シンプルなAssistants API を用いた攻撃自律攻撃を行うエージェント効果的なエージェントの作成の既存手法3エージェントによる計画・実行・再計画のループ機構プロンプトの改善と結果おわりに 1. はじめに Sreake事業部インターン生の荒木です。2023年10月から長期インターン生としてKubernetesやSRE関連技術、LLMなど幅広い領域にわたって調査・検証を行っています。 今回は、ChatGPT Assistantsを用いて脆弱性診断の観点から任意のWebサイトを攻撃するLLM Agentを作成いたしました。概要としてはFunction Callが使用可能なChatGPT Assistantsを用いた単純なモデルでの試行した後、プログラムを作成して攻撃手法の考案から攻撃の実行、フィードバックの試行ループをLLMのみで実現させました。このLLM Agentにより、OWASP juice shopのnullバイトインジェクション攻撃を実行することができます。この記事では、その過程で得られた知見についてまとめますが、あくまでも、サイバーセキュリティ上の潜在的なリスク調査とLLMエージェントのプロンプトエンジニアリングに関してのナレッジの共有が目的です。試した攻撃手法も比較的簡単であり、プロンプトにも改善の余地があるため、深刻なリスクになりうるとは思いませんが、倫理的な違反のある用途に用いないでください。 とはいえ、安易な再現性の提供は、セキュリティ上の懸念点があります。そのため、ソースコード全体の記載は行いません。提示するのはプロンプトが大半ですが、LLMモデルの更新により、現時点での記事の内容と異なる挙動を示す可能性に留意してください。 2. LLMによるハッキングの先行事例 まずは、Webサイトを攻撃するLLM Agentに関係する論文を挙げさせていただきます。 LLM Agents can Autonomously Hack Websites 2024年2月頃、AIエージェントのハッキング目的での使用についての論文が投稿されました。 LLM Agents can Autonomously Ha...
author
Sreake事業部
updated
1765115785
block type
0
extracted fields
237
extracted bits
featured image
article author
title
full content
content was extracted heuristically
OpenGraph suggests this is an article
detected location
0
detected language
1 (English)
category id
index version
2025110801
paywall score
0
spam phrases
0
text nonlatin
8187
text cyrillic
0
text characters
33174
text words
5414
text unique words
1554
text lines
1
text sentences
280
text paragraphs
1
text words per sentence
19
text matched phrases
28
text matched dictionaries
8
links self subdomains
0
links other subdomains
5
links other domains
0
links spam adult
0
links spam random
0
links spam expired
0
links ext activities
3
links ext ecommerce
0
links ext finance
0
links ext crypto
0
links ext booking
0
links ext news
0
links ext leaks
0
links ext ugc
9
links ext klim
0
links ext generic
0
image author