Skip to content

Instantly share code, notes, and snippets.

@uchidama
uchidama / create_unity_assets_dirs.sh
Last active April 16, 2024 17:02
# Unityフォルダ構成のルールについて # https://qiita.com/takish/items/8608ba9070755da3ae6d # ここで書かれたフォルダ構成をUnityの空のプロジェクトを作ったあとに作成するスクリプト # 空のプロジェクトのルートフォルダにおいて実行
#!/bin/bash
#
# Unityフォルダ構成のルールについて
# https://qiita.com/takish/items/8608ba9070755da3ae6d
# ここで書かれたフォルダ構成をUnityの空のプロジェクトを作ったあとに作成するスクリプト
# 空のプロジェクトのルートフォルダにおいて実行
# Base directory for Unity project Assets
base_dir="./Assets"
@uchidama
uchidama / the_stack_load.py
Created March 6, 2024 06:02
he-stackデータセットから10MBだけ読み込んで、先頭を表示する
# the-stackデータセットから10MBだけ読み込んで、先頭を表示する
import sys
from datasets import load_dataset
dataset = load_dataset("bigcode/the-stack", split="train", streaming=True)
data_subset = []
total_size = 0
# 参考URL:
# https://note.com/oriki111/n/n49ae98873a98?sub_rt=share_h
# 実行コマンド。実行時間のログをテキストに書いておく
# python3 mc4_load.py | tee mc4_load.txt
# 仮想環境の作成
# python3.12 -m venv myenv
# 仮想環境をアクティベート
'''
データセット関連の情報
https://huggingface.co/datasets/graelo/wikipedia <- 日本語データセット読める
https://huggingface.co/datasets/wikipedia <- 日本語データセット読めない
https://dumps.wikimedia.org/jawiki/
'''
'''
実行コマンド。実行時間のログをテキストに書いておく
# python3 wikipedia_en_load.py | tee wikipedia_en_load.txt
@uchidama
uchidama / wikipedia_jp_load.py
Last active February 20, 2024 05:50
wikipedia日本語データセットの読み込み
# 参考URL:
# GoogleColobで小規模言語モデル(0.15B)の事前学習モデルを作ってみる
# https://ayousanz.hatenadiary.jp/entry/2024/01/23/225623
#
'''
データセット関連の情報
https://huggingface.co/datasets/graelo/wikipedia <- 日本語データセット読める
https://huggingface.co/datasets/wikipedia <- 日本語データセット読めない
https://dumps.wikimedia.org/jawiki/
@uchidama
uchidama / Japanese_LLM_Pretraining_Datasets.md
Last active February 19, 2024 05:36
データセット
@uchidama
uchidama / pillow_with_opencv_findContours.ipynb
Last active January 13, 2024 15:57
Pillow to Opencv to find Contours, and back to Pillow Image.
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
@uchidama
uchidama / fashion_mnist_to_jpg.py
Last active March 24, 2023 02:35
Convert fashion_mnist data on keras datasets to jpeg images.
import keras
from keras.datasets import fashion_mnist
import numpy as np
from PIL import Image, ImageOps
import os
def save_image(filename, data_array):
im = Image.fromarray(data_array.astype('uint8'))
im_invert = ImageOps.invert(im)
@uchidama
uchidama / stablediffusionui-voldemort-v1-2-trinartv1.ipynb
Last active October 18, 2022 08:58
stablediffusionui-voldemort-v1-2-trinartv1.ipynb
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
@uchidama
uchidama / stablediffusionui-voldemort-v1-2-waifudiffusionv1-3-easystart.ipynb
Last active October 11, 2022 05:09
stablediffusionui-voldemort-v1-2-waifudiffusionv1-3-easystart.ipynb
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.