ITNEPPer来てくれ質問がある ID:r23OVhxS

1 ：以下、名無しにかわりましてVIPがお送りします：2018/11/17(土) 18:56:00.95 ID:r23OVhxS

pythonのスクレイピングで、ネット上のtxtデータを取得しようとしてるんだけど目的の内容のサイトが少ない+古いで詰んでる
http://giraffe.topaz.ne.jp/wiki/doku.php/py:lesson3_web
↑参考にしたのはこのサイトで、このサイトの
http://giraffe.topaz.ne.jp/wiki/lib/exe/fetch.php/py:leavetime.txt
を取得しようとしている
でもこれ6年前の記事でurllibはもうurllib3だし3にはurlopenっていうのはないらしい
どうやって値を取得すればいいの？

使用言語はPython3.7.0

2 ：以下、名無しにかわりましてVIPがお送りします：2018/11/17(土) 18:58:07.19 ID:r23OVhxS

要約すると
・ネット上から.txtの中身を取得したい
・Python３でのやり方が分からない

今はここで詰んでるけど、後で
「指定した文字以降の文字列を取得する」方法を教えてほしい

4 ：以下、名無しにかわりましてVIPがお送りします：2018/11/17(土) 19:06:04.58 ID:r23OVhxS

>>1のtxtデータを１行ずつ取得して配列に入れたい
その際、データは「:」以降の文字列だけ取って
その後、「分」という言葉を取得したデータと結合させたい

だから例えばprint(minute[0])と書くと
txt一行目の「41」を取得して、「分」と結合させるから
「41分」って出力させたい

わかりにくくてすまん

5 ：以下、名無しにかわりましてVIPがお送りします：2018/11/17(土) 19:07:15.53 ID:r23OVhxS

>>3毎度すまねえ試してみる
urllibのurlopenはrequestに変わったって認識で行くわ
そこら辺はちょっと調べてくる

6 ：以下、名無しにかわりましてVIPがお送りします：2018/11/17(土) 19:15:08.42 ID:r23OVhxS

やってみた
【コード】
import urllib.request
f = urllib.request.urlopen("http://giraffe.topaz.ne.jp/wiki/lib/exe/fetch.php/py:leavetime.txt")
print(f)

出力結果
<http.client.HTTPResponse object at 0x10e6c65f8>
[Finished in 0.382s]

なんかこう、
19:41
22:25
19:31
20:09
21:51…
って出る訳じゃ無いんだな

別にurllibにこだわってるわけじゃなくて、beautifulsoup4（聞いたことあるだけ）とか利用した方法を教えてくれても構わない

8 ：以下、名無しにかわりましてVIPがお送りします：2018/11/17(土) 19:19:22.74 ID:r23OVhxS

pip list確認したけどurllib3　1.23 だけで無印や２入ってなかった
けど動いた
ちなみにコードをurllib3にすると
AttributeError: module 'urllib3.request' has no attribute 'urlopen'
ってエラーが出る

このIDをNGリストに追加する

今後このIDの書き込みやスレッドを表示したくない場合、以下のボタンをクリックしてください。

NGリストに追加

このスレッドは過去ログです。