1 :以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 18:56:00.95 ID:r23OVhxSpythonのスクレイピングで、ネット上のtxtデータを取得しようとしてるんだけど目的の内容のサイトが少ない+古いで詰んでる
http://giraffe.topaz.ne.jp/wiki/doku.php/py:lesson3_web
↑参考にしたのはこのサイトで、このサイトの
http://giraffe.topaz.ne.jp/wiki/lib/exe/fetch.php/py:leavetime.txt
を取得しようとしている
でもこれ6年前の記事でurllibはもうurllib3だし3にはurlopenっていうのはないらしい
どうやって値を取得すればいいの?
使用言語はPython3.7.0
2 :以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 18:58:07.19 ID:r23OVhxS要約すると
・ネット上から.txtの中身を取得したい
・Python3でのやり方が分からない
今はここで詰んでるけど、後で
「指定した文字以降の文字列を取得する」方法を教えてほしい
4 :以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 19:06:04.58 ID:r23OVhxS>>1のtxtデータを1行ずつ取得して配列に入れたい
その際、データは「:」以降の文字列だけ取って
その後、「分」という言葉を取得したデータと結合させたい
だから例えばprint(minute[0])と書くと
txt一行目の「41」を取得して、「分」と結合させるから
「41分」って出力させたい
わかりにくくてすまん
5 :以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 19:07:15.53 ID:r23OVhxS>>3毎度すまねえ試してみる
urllibのurlopenはrequestに変わったって認識で行くわ
そこら辺はちょっと調べてくる
6 :以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 19:15:08.42 ID:r23OVhxSやってみた
【コード】
import urllib.request
f = urllib.request.urlopen("http://giraffe.topaz.ne.jp/wiki/lib/exe/fetch.php/py:leavetime.txt")
print(f)
出力結果
<http.client.HTTPResponse object at 0x10e6c65f8>
[Finished in 0.382s]
なんかこう、
19:41
22:25
19:31
20:09
21:51…
って出る訳じゃ無いんだな
別にurllibにこだわってるわけじゃなくて、beautifulsoup4(聞いたことあるだけ)とか利用した方法を教えてくれても構わない
8 :以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 19:19:22.74 ID:r23OVhxSpip list確認したけどurllib3 1.23 だけで無印や2入ってなかった
けど動いた
ちなみにコードをurllib3にすると
AttributeError: module 'urllib3.request' has no attribute 'urlopen'
ってエラーが出る
このIDをNGリストに追加する
今後このIDの書き込みやスレッドを表示したくない場合、以下のボタンをクリックしてください。
NGリストに追加
このスレッドは過去ログです。