ITNEPPer来てくれ質問がある ID:r23OVhxS

1以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 18:56:00.95 ID:r23OVhxS

pythonのスクレイピングで、ネット上のtxtデータを取得しようとしてるんだけど目的の内容のサイトが少ない+古いで詰んでる
http://giraffe.topaz.ne.jp/wiki/doku.php/py:lesson3_web
↑参考にしたのはこのサイトで、このサイトの
http://giraffe.topaz.ne.jp/wiki/lib/exe/fetch.php/py:leavetime.txt
を取得しようとしている
でもこれ6年前の記事でurllibはもうurllib3だし3にはurlopenっていうのはないらしい
どうやって値を取得すればいいの?

使用言語はPython3.7.0

2以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 18:58:07.19 ID:r23OVhxS

要約すると
・ネット上から.txtの中身を取得したい
・Python3でのやり方が分からない

今はここで詰んでるけど、後で
「指定した文字以降の文字列を取得する」方法を教えてほしい

4以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 19:06:04.58 ID:r23OVhxS

>>1のtxtデータを1行ずつ取得して配列に入れたい
その際、データは「:」以降の文字列だけ取って
その後、「分」という言葉を取得したデータと結合させたい

だから例えばprint(minute[0])と書くと
txt一行目の「41」を取得して、「分」と結合させるから
「41分」って出力させたい

わかりにくくてすまん

5以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 19:07:15.53 ID:r23OVhxS

>>3毎度すまねえ試してみる
urllibのurlopenはrequestに変わったって認識で行くわ
そこら辺はちょっと調べてくる

6以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 19:15:08.42 ID:r23OVhxS

やってみた
【コード】
import urllib.request
f = urllib.request.urlopen("http://giraffe.topaz.ne.jp/wiki/lib/exe/fetch.php/py:leavetime.txt")
print(f)

出力結果
<http.client.HTTPResponse object at 0x10e6c65f8>
[Finished in 0.382s]

なんかこう、
19:41
22:25
19:31
20:09
21:51…
って出る訳じゃ無いんだな

別にurllibにこだわってるわけじゃなくて、beautifulsoup4(聞いたことあるだけ)とか利用した方法を教えてくれても構わない

8以下、名無しにかわりましてVIPがお送りします:2018/11/17(土) 19:19:22.74 ID:r23OVhxS

pip list確認したけどurllib3 1.23 だけで無印や2入ってなかった
けど動いた
ちなみにコードをurllib3にすると
AttributeError: module 'urllib3.request' has no attribute 'urlopen'
ってエラーが出る


このIDをNGリストに追加する

今後このIDの書き込みやスレッドを表示したくない場合、以下のボタンをクリックしてください。
NGリストに追加

このスレッドは過去ログです。