Pandas становится смехотворно медленным при загрузке более 10 миллионов записей из базы данных SQL Server с использованием pyodbc и, в основном, функции pandas.read_sql(query,pyodbc_conn). Следующий код загружает 10-15 миллионов записей из таблицы SQL за 40-45 минут: Table1
Есть ли лучший и более быстрый способ чтения таблицы SQL в pandas Dataframe?
import pyodbc
import pandas
server = <server_ip>
database = <db_name>
username = <db_user>
password = <password>
port='1443'
conn = pyodbc.connect('DRIVER={SQL Server};SERVER='+server+';PORT='+port+';DATABASE='+database+';UID='+username+';PWD='+ password)
cursor = conn.cursor()
data = pandas.read_sql("select * from Table1", conn) #Takes about 40-45 minutes to complete
rows = cursor.execute("select * from Table1").fetchall()
занимает такое же количество времени? - person Gord Thompson   schedule 20.11.2018