##(再)入門自然言語処理 #02(@yamano357) ###質問
- エンジニアの人が文書を扱う時に今回の発表の中でどれぐらい知っておくべきでしょうか。(もちろん全部知っておくべきだとは思いますが)
- 前回同様、密度が濃くて勉強になりました。TD-IDFを使う際に、事前に文書集合が与えられていればDFを計算できるが、オンライン学習など事前に文書集合がない場合どのようなベクトル化が良いのかを伺いたいです。
- IDF求めるときに使うコーパスとして具体的にどのようなものがあるのでしょうか? コーパスによって結果が変わったり偏ったりすることがあると思います。これらの問題を解決する方法はあるのでしょうか?
- P21 表記ゆれ・言い換え、実際に実適用としてどのように処理すると効果高いか?
- P22 トピックモデルのスライドに入るとき「表記ゆれ・言い換えの解決として、トピックモデルも使われる」とあったがどう使われるか?
- 今の発表を理解できないレベルの初心者は何からはじめたら良いでしょうか。
- トピックを想定した後、そのトピックが何を表しているのかはどう判断すればよいのでしょうか?
- 自分の復習+新しい事について知れてとても良かったです。各次元削減の手法の特徴(良い点・悪い点)について教えていただけませんでしょうか。