Skip to content

Instantly share code, notes, and snippets.

const express = require('express')
const app = express();
const esclient = require('@elastic/elasticsearch');
const axios = require('axios');
const fetch = require('node-fetch');
const http = require('http');
const { execSync } = require('child_process');
const port = 3000
const dstport = 9200;
@dakeshi19
dakeshi19 / applysamples.py
Last active November 6, 2021 10:30
Pandasのapply関連の書きっぷりバリエーションと処理時間の雑な傾向確認
import numpy as np
import random
import pandas as pd
import numpy as np
import sys
import inspect
"""
Pandasでapply、特にaxis=1で処理したくなるような要件の可読性と速度の雑な確認
(IPythonのREPLに貼り付けしてためした)
@dakeshi19
dakeshi19 / spacy_match.py
Created September 18, 2020 08:33
spaCyのMatchのお試し
import sys
import spacy
from spacy.matcher import Matcher
import re
nlp = spacy.load('ja_core_news_md')
_text = """
関西国際空港側の居酒屋で、酒を飲みすぎたため、電車で眠りこけてしまったため、寝過ごしてしまった。終点の駅で目が醒めたのだが、周りに何もなくてとても淋しい気持ちになった。ふと夜空を見上げると、八分咲きの美しい桜の花が慰めてくれるようだった。
@dakeshi19
dakeshi19 / kw_extractor_practice.py
Created August 21, 2020 12:48
spaCyの練習
import json
import spacy
import re
import sys
import itertools
nlp = spacy.load('ja_core_news_md')
nlp.remove_pipe('ner') # 固有表現は使わないので除外
数詞 = ('名詞-数詞', '名詞-数詞-')
@dakeshi19
dakeshi19 / es2df_sample.py
Last active June 20, 2020 13:34
pandasのDataFrameに格納
import elasticsearch
import pandas as pd
es = elasticsearch.Elasticsearch("localhost:9200")
INDEX = 'ldgourmet'
AGGS = "aggregations"
BKTS = "buckets"
aNames = ['a1','a2']
@dakeshi19
dakeshi19 / GiNZAdeSumy.py
Created June 7, 2020 11:50
sumyでドキュメント要約を行うサンプルプログラム
"""
sumyでドキュメント要約を行うサンプルプログラム
"""
# spaCy
import spacy
# sumy
from sumy.parsers.plaintext import PlaintextParser
# 以下、要約アルゴリズム
from sumy.summarizers.lex_rank import LexRankSummarizer
@dakeshi19
dakeshi19 / ldbulk.py
Last active June 2, 2020 14:31
livedoor グルメのDataSet のCSVをElasticsearchでの全文検索を意識して結合〜JSONデータ化してバルクロード実行するサンプルスクリプト
import pandas as pd
from collections import defaultdict
from collections import ChainMap
from elasticsearch import Elasticsearch
from elasticsearch.helpers import bulk
"""
livedoor グルメのDataSet のCSVをElasticsearchでの全文検索を意識して結合
〜JSONデータ化してバルクロード実行するサンプルスクリプト
@dakeshi19
dakeshi19 / myAnalyzerConfGeneratorMod.py
Created May 24, 2020 16:00
Elasticsearchの日本語関係のanalyzer設定のJsonテキストを出力するツール(ただし汎用ではなく、筆者のフェイバリット設定です)
def set_analyzer(an, tk, fl):
# ======================== ここからtokenizerとfilterの定義 ===============================
def _set_filter_and_tokenizer(tk, fl):
デフォルトとするtoken_chars = [ # N-Gramで分かち書きするフィールドでターゲットとする文字種(最近、symbolは入れる方が良いと思い始めている)
"letter",
"digit",
"symbol"
@dakeshi19
dakeshi19 / prepre.py
Created May 10, 2020 09:12
前捌きpandasスニペットなど
import pandas as pd
import glob
import sys
import itertools
import re
import json
import collections
import itertools
import io
@dakeshi19
dakeshi19 / 00README.txt
Last active June 18, 2020 23:10
WebRTC
https://itdepends.hateblo.jp/entry/2020/05/04/120500
WebRTCの勉強のためのサンプルプログラムです。
自由に改変してかまいません。
利用は自己責任でお願いします。