NETSEAからJANコードを1万件抽出する方法を解説

JANコード抽出

ども、まじめです。

前回の記事では「楽JAN」を使ってカワダオンラインをリサーチしました。

で、今度は同じネット問屋の「NETSEA」をリサーチしたいんですが、こちらはカワダさんとは違い、JANコードを抽出するのにひと手間かかる為、今回の記事ではリサーチの前段階として「NETSEA」からJANコードを抽出する方法を解説したいと思いますので、興味のある方は是非最後までご覧下さい。

実は2年ほど前に「無料ツールだけで40分!ネット卸NETSEAのJANコード1万件を抽出して一気にリサーチする方法を公開します。」というタイトルの無料レポートを発行しました。

今回ブログで公開するにあたり、実際に検証して加筆修正を加えています。

NETSEAとは

仕入れ・卸・問屋のNETSEAは小売店が問屋(卸会社)から商品を仕入れることができる、
会員登録無料のサイトです。

メーカー、問屋、卸会社などのサプライヤーが
取扱商品についての情報や卸売の価格を掲載しております。

卸先を見つけたい問屋と仕入れをしたい小売店のお手伝いをNETSEAがいたします。
日本最大級の仕入れ・問屋・卸の専門サイトのNETSEAを是非ご利用ください。

(NETSEAのホームページから抜粋)

NETSEA自体が問屋という訳ではなく、卸や問屋と小売店との仲介サービスというところでしょうか。NETSEAによると「約5,000社、170万アイテムが揃う国内最大級WEB仕入れサイト」との事で、お宝問屋を見つけ出せるかもしれません。(^^

ただし商品を仕入れるには、問屋(サプライヤー)への取引申請が必要で条件によっては取引できない場合もあります。

NETSEAからJANコードをダウンロードする

まずはNETSEAにアクセスして、ログインして下さい。(会員登録が済んでない方は画面上部の「仕入れ会員登録する」から済ませて下さい。)

トップページの検索窓にキーワードを入力して出てきた商品のJANコードを抽出してもいいのですが、各サプライヤーとも、送料無料までの金額が高い為、サプライヤー単位で検索した方がいいと思います。

今回はみんな大好き「ハリマ共和物産」さんの商品一覧から抽出したいと思いますので、検索窓に「ハリマ共和物産」と入力して検索して下さい。(取引申請は完了しているものとします。)

NETSEA ハリマ共和物産

商品データをダウンロードするには以下の条件がある為、赤枠の「条件で絞り込む」の該当箇所にチェックを入れておいて下さい。

  • 取引申請が承認されているサプライヤーの商品
  • 消費者直送可能な商品
  • 画像転載可になっている商品
  • 商品タイトル冒頭に「PR」という枠が記載されていない商品

チェックができたら、下記画像赤丸の「商品データダウンロード」をクリック。

NETSEA ハリマ共和物産

「商品データダウンロード」画面で「商品情報(CSV)のみ」にチェックし「商品データダウンロード」をクリック。

NETSEA ハリマ共和物産

しばらくするとダウンロードフォルダの中に「itemdata_~.zip」という圧縮ファイルがダウンロードされるので、あとはページを送って同じ手順でどんどんダウンロードします。(一つのファイルに約60商品分のデータが入っています。)

以前はクリック後すぐにダウンロードされましたが、大量ダウンロード抑制の為か、一つダウンロードするのに時間がかかるようになりました。(暇なときに根気よくポチポチして下さい。)

今回は9ページ分(約500商品分)ダウンロードしました。

ダウンロードフォルダの中身

ダウンロードしたJANコードファイルを解凍する

Windowsに標準で備わっている機能では一つづつしか解凍できない為、フリーソフトの「+Lhaca」を使って解凍します。(こちらからダウンロード後、インストールして下さい。)

デスクトップのアイコンから起動して以下のように設定して下さい。解凍先をデスクトップにすると数が多い場合大変な事になるので、その他にチェックして任意のフォルダを指定して下さい。僕はデスクトップに「JAN」というフォルダを作成し下記のように設定しました。(以下「JAN」フォルダを作成したものとして説明します。)

+Lhaca設定画面

準備ができたら先ほどダウンロードしたファイルを全て選択し「+Lhaca」のアイコンにドラッグアンドドロップするとデスクトップに作成した「JAN」というフォルダに全て解凍されます。

解凍したJANコードファイルを一つに結合する

一つ一つ手作業で結合しても良いのですが、今回はExcelのパワークエリの一部の機能を使って結合を行います。(Excel2016より前のバージョンでは別途機能を追加する必要がありますが、今回は割愛します。)

先ずは空白のブックを作成し

「データ」タブ → 「データの取得」 → 「ファイルから」 → 「フォルダから」

の順にクリックし、解凍したJANコードファイルが入っている「JAN」フォルダを選択して下さい。

Excel パワークエリ起動

表示されているデータを確認し

「結合」 → 「結合および読み込み」

を選択して「OK」をクリック。その後出る「Fileの結合」画面でも「OK」をクリック。

Excel パワークエリ

総数890件の一つのJANコードファイルが作成されました。(ハリマさんはセット品も多いので件数が予定より多くなりました。)

ファイルを適当な名前で保存しておいて下さい。

パワークエリで結合されたJANコードファイル

セット品を除外する

最後に作成されたJANコードファイルからセット品を除外します。(ファイルを見るとセット卸額の税込はあるが卸価格単価の税込が無い為。)

ツールで計算すれば良いのですが、次回はNETSEA専用のツールではなく汎用ツール(問屋自由形式)にてリサーチしたい為。詳細は次回の投稿で。

作成された状態で、すでにフィルターの為の矢印が出ている為、「セット毎数量」で「1」のチェックを外し「OK」をクリックして下さい。

Excel フィルター画面

表示されているデータ全ての行を選択して削除して下さい。(見出しは残しておいて下さい。)

2行目の行を選択し、Ctrl + Shift + ↓ で一気に選択できます。

再びフィルターで「セット毎数量」の「1」にチェックをつけ「OK」をクリックし上書き保存しておいて下さい。

まとめ

いかがでしたか?

少し手間はかかりますが、特別なツールを使わなくても、慣れてしまえば簡単にNETSEAからJANコードファイルを抽出する事ができます。現在1ファイルのダウンロードに時間がかかっていますが、以前は1万件のJANコードファイルを40分ほどで作成できました。

スクレイピング的なツールも検討していますが、大量のデータをダウンロードするとアクセス制限される場合もある為、考え中です。あとはセレニ〇〇とかですかね。

次回は抽出したJANコードファイルを「楽JAN」でリサーチしますので、お楽しみに~。

タイトルとURLをコピーしました