DOBON.NET DOBON.NETプログラミング掲示板過去ログ

ホームページ上のファイルについて

環境/言語:[Vista、VB.NET]
分類:[.NET]

いつもお世話になります。

早速ですが、あるホームページのアドレス以下に属するファイルの一覧を取得するには、どういった方法があるのでしょうか?

例えば、yahooのトップページの画像ファイルの一覧を取得する方法を教えていただきたいのです。

よろしくお願い致します。
2009/11/29(Sun) 00:47:21 編集(投稿者)

HTTP なら、サーバによってはディレクトリをそのまま公開しているところもありますが、一般的には公開していません。ですので一覧も取得できません。

FTP で自分の管理下の、などということならまた話は別ですが。
■No25928に返信(Hongliangさんの記事)
> 2009/11/29(Sun) 00:47:21 編集(投稿者)
>
> HTTP なら、サーバによってはディレクトリをそのまま公開しているところもありますが、一般的には公開していません。ですので一覧も取得できません。
>
> FTP で自分の管理下の、などということならまた話は別ですが。

もし、URLが判明していたとしても難しいのでしょうか?
URL が不明というのならそもそも一覧以前の話では?
■No25929に返信(tomoさんの記事)
> ■No25928に返信(Hongliangさんの記事)
>>2009/11/29(Sun) 00:47:21 編集(投稿者)
>>
>>HTTP なら、サーバによってはディレクトリをそのまま公開しているところもありますが、一般的には公開していません。ですので一覧も取得できません。
>>
>>FTP で自分の管理下の、などということならまた話は別ですが。
>
> もし、URLが判明していたとしても難しいのでしょうか?

たとえば、そのURLのページで使われている画像の一覧なら、HTMLを解析することで可能です。
ですが、最初の質問内容からすると、「そのURLのページで表示されていない、ドメインに所属するすべてのファイル一覧が欲しい」ということだと思いますが、それはおそらく不可能でしょう。(特に他者のページならばなおさら)
理由は「一覧が公開されないように設定されている」から。
URLが判明している、していないに関わらず、「一覧取得用のアクセスはアクセス禁止として、エラー403 Forbiddenを返答する」という設定がされていると思われます。

自分が管理している部分なら、Hongliangさんが書いてあるとおり、FTPを利用するなどで可能です。

ところで、他人が公開しないようにしている画像なんかも取得が可能にしたいという内容の質問ですが、なぜそのようなことをしたいのでしょうか?
■No25927に返信(tomoさんの記事)
> 例えば、yahooのトップページの画像ファイルの一覧を取得する方法を教えていただきたいのです。

これだけであれば単純にimgタグを解析すれば可能です。
難しいことはありません。

DOBON.NET | プログラミング道 | プログラミング掲示板