download the page specified by each row

2019-12-18 16:52:11 -05:00 · 2019-12-18 16:52:11 -05:00 · 2887636034
commit 2887636034
parent e7154b4975
1 changed files with 8 additions and 0 deletions
--- a/version.py
+++ b/version.py
@ -4,6 +4,8 @@
 import psycopg2
 import wget
 import sys
+import requests
+import urllib.request

 con = None

@ -16,8 +18,14 @@ try:
    cur.execute('SELECT code, url FROM scrape.raw')

    urls = cur.fetchall()
+    headers = {
+    'User-Agent': "Mozilla/5.0 (X11; Linux x86_64)"
+    }
    for row in urls:
        print(row[0],row[1])
+        #cont = wget.download(row[1])
+        html = requests.request("GET",row[1],headers=headers)
+        print(html.text)

 except psycopg2.DatabaseError as e: