5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

【衝撃!】消し去ったはずのWebページga保管する

1 : :01/10/27 20:53 ID:aRT00jL+
ttp://web.archive.org/
ニュース速報+からの転載です…

1 名前:夜汽車φ ★ 投稿日:01/10/27 16:54 ID:???
インターネットの過去を保管,Webアーカイブが公開される
100億以上のWebページを保管する世界最大のインターネット図書館
が開館した。もうなくなったと思われていたページや,作成者としては
できるものなら抹消したいと思っているページなど,さまざまなWeb
ページが保管されている。

http://www.zdnet.co.jp/news/0110/27/b_1026_08.html

860 :あぼーん:あぼーん
あぼーん

861 :Name_Not_Found:02/04/01 06:56 ID:t/E4sb4I
すげー割れファイルまで全て保管してある。。。

862 :Name_Not_Found:02/04/02 01:51 ID:YR8YUywH
なんかあったの?

863 :Name_Not_Found:02/04/02 20:42 ID:1iJWyVHf
860はコピペだったyo>862

864 :Name_Not_Found:02/04/03 18:30 ID:m69ka33S
このスレまだあったのか

865 :Name_Not_Found:02/04/04 20:02 ID:vCx5/80q
>>863
てっきり、割れ物のURLかと思って期待しちゃったよ。

866 :権兵衛:02/04/11 18:14 ID:bzw8Szrt
archiveについて。
週刊アスキーの後ろの方に、出ているね。まるまる2ページも使って。
著作権のことをもう少し、つっこんで欲しかった。

867 :34:02/04/11 18:34 ID:ax05AkZn
AE

868 :Name_Not_Found:02/04/15 18:47 ID:sDH3wsK9
http://web.archive.org/web/19961108090923/http://www.kantei.go.jp/

869 :Name_Not_Found:02/04/23 00:28 ID:qAf45AMl
保全

870 :Name_Not_Found:02/04/30 07:54 ID:wmXLHktv
>>866
週アスはいつもツッコミが足りない。

871 :Name_Not_Found:02/05/03 00:26 ID:+AggAXkh
結局、ttp://web.archive.org/ ロボット避けのタグか何か対処法はありますか?


872 :Name_Not_Found:02/05/03 00:37 ID:V/8WiqRL
>871
.htaccess と robots.txt の併用が今のところベストか?

とりあえず過去ログからピックアップ
>>315
>>485-486 >>495
>>674
>>847
あたりかな。
他にもいろいろ参考情報があるから過去ログを読みなおすと吉。

873 :872:02/05/03 00:40 ID:V/8WiqRL
あ、<や>はもちろん半角の<や>に直さないといけないよ。
htaccessについては↓ここなんか参考になるかも。

http://www.mikeneko.ne.jp/~lab/web/htaccess/

874 :Name_Not_Found:02/05/03 01:30 ID:3R2xIW24
SetEnvIf User-Agent "ia_archiver" archiver
Order Allow,Deny
Allow from all
Deny from env=archiver
Deny from .alexa.com
Deny from .archive.org

俺のところこれで防いでる。
ホスト名だと変換できない場合もあるからUAでも防御してる。
SSIが使えないところだとこれは無理と思うが。

あと>>495の方法でrobots.txtも使えばもっとよくなると思うよ。

875 :871:02/05/03 10:15 ID:9gPgwWdA
なるほどー!

876 :Name_Not_Found:02/05/03 10:46 ID:vKIcQIEn
個人的には一度公開した文書は消さないで欲しいところ

877 :ブラクラ:02/05/03 11:09 ID:LRbqlMK5
はじめから、もう一つ見つからないような場所に、垢取りして、同じ内容のページにしておくのはどうかな?

878 :Name_Not_Found:02/05/03 11:13 ID:ZKxslU6G
今度、サイトを再開する時、「archive除け」しなきゃなぁ、と思ってるのですが…。
いろいろ大変そうですね。

許可無く保存するなよなぁ…。

879 :Name_Not_Found:02/05/03 12:45 ID:/kvISVhk
…とっくの昔にガイシュツなんだけどね、WEBアーカイブ。

880 :Name_Not_Found:02/05/04 18:23 ID:yRPpOEPY
でも保存されることが分かっててサイト作るなら、
それを前提としてUPすればいいだけで…

ま、知らない人が多いんですが。

881 :Name_Not_Found:02/05/04 20:28 ID:2SoP+fgg
>>874
> あと>>495の方法でrobots.txtも使えばもっとよくなると思うよ。

robots.txtだけアクセス許可しておかないと無意味なので注意

<Files robots.txt>
Allow from all
</Files>

882 :Name_Not_Found:02/05/16 01:19 ID:9CJgcmbU
age


883 :Name_Not_Found:02/05/23 07:28 ID:asSsFlkh
つか保存されて困るようなページを公開すんな

884 :Name_Not_Found:02/05/23 08:05 ID:JFqGQ05L
馬鹿にはそれが分からんのです。

885 :Name_Not_Found:02/05/23 11:23 ID:vu6vukkE
VBSWGがDLできない。

886 :Name_Not_Found:02/05/26 14:07 ID:cUMFp9dv
ttp://www.archive.org//ubbthreads/

887 :Name_Not_Found:02/06/03 21:54 ID:qZSSXGN6
今日来たアクセス。ホスト名は引けませんでした。
IP address : 66.28.250.173
user agent : ia_archiver

http://www.checkdomain.com/cgi-bin/checkdomain.pl?domain=66.28.250.173
---
Registrant:
Cogent Communications

888 :Name_Not_Found:02/06/04 08:19 ID:LQiGiIMm
保存されて困ったらそれからクレームつけりゃいいよ。
2〜3日中に凍結されるから。アクセス弾くのにやっきになるより楽。

889 : ◆xrea197s :02/06/05 00:22 ID:2z3M3ctO
ありえない

890 :Name_Not_Found:02/06/05 22:22 ID:n+zZyAPj
>>889
それは888の俺のレスに関して言ってるのか?
ありゃ本当だよ。つーか俺がそうした。意外とあっさり凍結してくれた。
英語が苦手なら簡単なテンプレみたいなのがこのスレにあるから探すよろし。

891 :Name_Not_Found:02/06/13 18:40 ID:YbdnFfVu
俺もinfo@archive.orgにメール出してみた。
3日後に「2-3営業日以内に削除する」って返事が来て、
さらに3日後には消えてたよ。
案外対処早いな。

892 :Name_Not_Found:02/06/28 03:47 ID:???
保全sage

893 :Name_Not_Found:02/06/29 04:39 ID:???
確かにsageなのになぜか上がっている謎

894 :Name_Not_Found:02/06/29 14:56 ID:???
板に復帰がかかったんじゃないの

895 :Name_Not_Found:02/07/02 22:33 ID:q0W7PMhp
なんか検索するとエロサイトに飛ぶんだけど。<WebArchive
クラックされたか?

896 :Name_Not_Found:02/07/02 22:37 ID:lRx5G3vK
俺も飛ばされたぞ

897 :Name_Not_Found:02/07/02 23:07 ID:???
詳細検索ページがヘンです。↓
http://web.archive.org/collections/web/advanced.html

困ったなあ。早く直らないものか。

898 :Name_Not_Found:02/07/02 23:39 ID:???
インターネットアーカイブ:ホームページよ、よみがえれ!
http://dhr.tripod.co.jp/simple_webarchive.htm
ウェブ・アーカイビングとInternet Archive Wayback Machineについて
http://www.ah.wakwak.com/~wing-x/webarchive/
>>高度検索(OfficeGooingさん)
http://gooing.com/htm/link/wayback2.html

899 :Name_Not_Found:02/07/03 00:59 ID:???
>>895-897
直ったみたいだね。ヨカッタ、ヨカッタ。

900 :Name_Not_Found:02/07/03 14:40 ID:???
2、3ヶ月前まであったサイトで、もう閉鎖しちゃったみたいで
web archiveでも復活できないんですがなぜなのでしょうか?
かなり長い期間あったサイトです。

統一協会系企業一覧
統一協会の関連施設です。コピーして配布ください。騙されないために。
これでも一部です。 1998.4/1更新  統一協会の施設を紹介します。
いわゆる統一協会〇〇教会という施設があり、それ以外にさまざまな関連施設が
あります。関連施設には、“統一協会ではない”、“宗教ではない”ということで
欺いて勧誘し、マインドコントロールで結局は信者にしてしまうという恐ろしい
ものがあります。親元を離れた若者に今春も被害が続出しています。  
これらの施設は、短期間で名称や形態を変えたり、移転したりすることがあり、
みなさんがご覧いただいたときに、その施設が変わっているかもしれませんので、
その節はご了承下さい。 (今回は主に、販売活動をする施設を紹介します。1998年調べ)
http://isweb29.infoseek.co.jp/diary/ozzy-fm/touitsu.html

901 :Name_Not_Found:02/07/03 14:52 ID:???
>>900
たまたま巡回してなかったんじゃない?
うちのサイトもページによっては長い間拾われてなかったりするよ。
禁止ワードとかは聞いたことないけど、無防備ではないはず。
とりあえず Google にはキャッシュされていた。
http://216.239.33.100/search?q=cache:isweb29.infoseek.co.jp/diary/ozzy-fm/touitsu.html+&hl=ja
どうぞご自分でミラーするなり何なりと。
# いやぁしかし、この中に個人的に嫌いなとこ紛れ込ましてもわからんね。

902 :900:02/07/03 14:59 ID:???
>>901
ああ、ありがとうございます!
このスレでやっていますのでお暇でしたら見て下さい。
http://tmp.2ch.net/test/read.cgi/asia/1025249576/l50
グーグルでどうやって検索したんですか?
URL等で検索しても引っかからなかったんですが。

903 :Name_Not_Found:02/07/03 19:11 ID:???
またおかしなところに飛ばされる。
どしたんだろ。

904 :Name_Not_Found:02/07/10 02:18 ID:???
こっちも参照。
【Robots】Googleアーカイブが嫌い【NoArchive】
http://pc.2ch.net/test/read.cgi/hp/1026114886/l50

905 :Name_Not_Found:02/07/14 01:32 ID:???
具体的に保存する形式はなんなんだろうな。
html gif png jpg exe css bmpは確認できたが。

906 :Name_Not_Found:02/07/15 20:57 ID:???
こわいこわい

907 :Name_Not_Found:02/07/16 01:53 ID:/nA6ob32
サイトを削除して欲しい時がどうすれば…
削除方法がみつからない。

サイト自体は3年も前ので今はもうない…
んでもって、現在は当時のプロバじゃないのでロボ弾きもできない
どうすればいいのでつか?

908 :Name_Not_Found:02/07/16 04:34 ID:???
>>907
過去は消せません。削除しようだなんて卑怯です。
男らしく十字架を背負って生きて下さい。

909 :Name_Not_Found:02/07/16 17:56 ID:???
俺が見たいのはことごとく残ってないのですが。
中途半端に残っているだけに口惜しい。

280 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.02 2018/11/22 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)