Main

type

5

status

21

review version

0

cleanup version

0

pending deletion

0

created at

2025-05-19 02:52:55

updated at

2025-11-27 11:22:24

Address

url

https://sreake.com/blog/llm_hacker_gpt/

url length

39

url crc

3764

url crc32

1372982964

location type

1

canonical status

10

canonical page id

2149403335

Source

domain id

200213792

domain tld

0

domain parts

0

originating warc id

-

originating url

https://sreake.com/post-sitemap.xml

source type

1

Server response

server ip

65.9.175.32

pubdate

2025-11-27 11:22:23

attempts

1

size orig

147265

size saved

93055

Content

page id

2149403335

title

Webサイトを自律攻撃するLLMのロジックを考えた | sreake.com | 株式会社スリーシェイク

excerpt

content

目次 目次 はじめにLLMによるハッキングの先行事例シンプルなAssistants API を用いた攻撃自律攻撃を行うエージェント効果的なエージェントの作成の既存手法3エージェントによる計画・実行・再計画のループ機構プロンプトの改善と結果おわりに 1. はじめに Sreake事業部インターン生の荒木です。2023年10月から長期インターン生としてKubernetesやSRE関連技術、LLMなど幅広い領域にわたって調査・検証を行っています。 今回は、ChatGPT Assistantsを用いて脆弱性診断の観点から任意のWebサイトを攻撃するLLM Agentを作成いたしました。概要としてはFunction Callが使用可能なChatGPT Assistantsを用いた単純なモデルでの試行した後、プログラムを作成して攻撃手法の考案から攻撃の実行、フィードバックの試行ループをLLMのみで実現させました。このLLM Agentにより、OWASP juice shopのnullバイトインジェクション攻撃を実行することができます。この記事では、その過程で得られた知見についてまとめますが、あくまでも、サイバーセキュリティ上の潜在的なリスク調査とLLMエージェントのプロンプトエンジニアリングに関してのナレッジの共有が目的です。試した攻撃手法も比較的簡単であり、プロンプトにも改善の余地があるため、深刻なリスクになりうるとは思いませんが、倫理的な違反のある用途に用いないでください。 とはいえ、安易な再現性の提供は、セキュリティ上の懸念点があります。そのため、ソースコード全体の記載は行いません。提示するのはプロンプトが大半ですが、LLMモデルの更新により、現時点での記事の内容と異なる挙動を示す可能性に留意してください。 2. LLMによるハッキングの先行事例 まずは、Webサイトを攻撃するLLM Agentに関係する論文を挙げさせていただきます。 LLM Agents can Autonomously Hack Websites 2024年2月頃、AIエージェントのハッキング目的での使用についての論文が投稿されました。 LLM Agents can Autonomously Ha...

author

Sreake事業部

updated

1765115785

Text analysis

block type

0

extracted fields

237

extracted bits

featured image
article author
title
full content
content was extracted heuristically
OpenGraph suggests this is an article

detected location

0

detected language

1 (English)

category id

Zastosowania AI (149)

index version

2025110801

paywall score

0

spam phrases

0

Text statistics

text nonlatin

8187

text cyrillic

0

text characters

33174

text words

5414

text unique words

1554

text lines

1

text sentences

280

text paragraphs

1

text words per sentence

19

text matched phrases

28

text matched dictionaries

8