ie_test
2018年8月1日水曜日
BigQuery-Python を使った際のハマりどころ
# 実行内容 BigQuery (以下BQ)でクエリ実行、一時テーブルの保存 -> 保存したテーブルを google cloud strage (以下GCS) へ export とする。 # 問題点など 1. BQ -> GCS のところで一つの GCS ファイルに転送しようとするとエラーになる。 なので転送先を TMP_GCS_FILE = "gs://a-test/my_result/tmp*.csv.gzip" のように * を含むようにする。 このようにするとコピーする際に適切なファイルのサイズに分割され、 tmp000000000000.csv.gzip, tmp000000000001.csv.gzip ... tmp000000000008.csv.gzip のようなファイル名で GCS 上に保存される。 2. BQ において query に ordered by でソートするようにしたらメモリオーバーでダメというエラーが生じた。bigQuery で ordered by はできないと考えた方が良いかも。
0 件のコメント:
コメントを投稿
次の投稿
前の投稿
ホーム
登録:
コメントの投稿 (Atom)
0 件のコメント:
コメントを投稿