Shubhanshu Mishra napsternxg

## parse_gpc_data.py
# Download the data from: https://gpc-browser.gs1.org/ using Download GPC as JSON

import json

data_file = "./data/GPC_May2024.json"
output_file = "./data/GPC_May2024.flattened.json"

with open(data_file) as fp:
    data = json.load(fp)

## lazy_val.py
from collections import defaultdict
from typing import Callable


class LazyVal:
    _uncomputed_val = object()

    def __init__(self, fn, *args, **kwargs) -> None:
        self._val = self._uncomputed_val
        self.args = args

## Walmart Info.md

      
              3 files
            
          
              0 forks
            
          
              0 comments
            
          
              0 stars
            
          
                napsternxg
                / Walmart Info.md
            
            
              Last active
              June 14, 2024 18:32
            
              
                Walmart Data
              
          
    Brands: https://www.walmart.com/brand/branddirectory
let nodes = document.querySelectorAll("#maincontent > div > div > div:nth-child(3) > div > div > div > a")
let data = Array.from(nodes).map(d => Object.assign({link: d.href, name: d.text}))
console.log(JSON.stringify(data, null, 2))
Departments: https://www.walmart.com/all-departments

  
## Colbertv2_Torch_Scratch.ipynb

      
              1 file
            
          
              0 forks
            
          
              0 comments
            
          
              0 stars
            
          
                napsternxg
                / Colbertv2_Torch_Scratch.ipynb
            
            
              Created
              January 24, 2024 18:04
            
              
                Colbertv2_Torch_Scratch
              
          
        Loading

      Sorry, something went wrong. Reload?
      Sorry, we cannot display this file.
      Sorry, this file is invalid so it cannot be displayed.
      
          Viewer requires iframe.
      
    
## onnx_edit.py
import onnx

model_path = "./model.onnx"
fixed_model_path = model_path.replace(".onnx", ".fixed.onnx")

# # Load the ONNX model which should have last layer as Sigmoid.
# LGBM Models may sometime not add the Sigmoid op during export when using regression loss
onnx_model = onnx.load(model_path)
print(onnx_model)
onnx.checker.check_model(onnx_model)

## TasteAtlas.ipynb

      
              2 files
            
          
              0 forks
            
          
              0 comments
            
          
              0 stars
            
          
                napsternxg
                / TasteAtlas.ipynb
            
            
              Last active
              October 24, 2023 21:06
            
              
                TasteAtlas
              
          
        Loading

      Sorry, something went wrong. Reload?
      Sorry, we cannot display this file.
      Sorry, this file is invalid so it cannot be displayed.
      
          Viewer requires iframe.
      
    
## display_ner.py
from IPython.display import display, HTML

class DisplayEntities:
    @classmethod
    def display(cls, texts, grouped_entities):
        html = []
        html.append(cls.get_style())
        for text, entities in zip(texts, grouped_entities):
            html.append(cls.show_entities(text, entities))
        display(HTML("".join(html)))

## generate.py
import functools

import pandas as pd
import torch
import transformers
from accelerate import Accelerator
from datasets import Dataset
from torch.utils.data import DataLoader
from tqdm.auto import tqdm

## async_queue_runner.py
import asyncio
import logging
import random
import time
from dataclasses import dataclass
from typing import Any

from tqdm.auto import tqdm

logger = logging.getLogger(__name__)

## setfit_sentence_transformer_fixed.py
from datasets import load_dataset, Dataset, DatasetDict
from sentence_transformers.losses import CosineSimilarityLoss
from sentence_transformers import SentenceTransformer

from setfit import SetFitModel, SetFitTrainer, sample_dataset
from sklearn.model_selection import train_test_split
import pandas as pd
import numpy as np
import json
	# Download the data from: https://gpc-browser.gs1.org/ using Download GPC as JSON

	import json

	data_file = "./data/GPC_May2024.json"
	output_file = "./data/GPC_May2024.flattened.json"

	with open(data_file) as fp:
	data = json.load(fp)
	from collections import defaultdict
	from typing import Callable


	class LazyVal:
	_uncomputed_val = object()

	def __init__(self, fn, args, *kwargs) -> None:
	self._val = self._uncomputed_val
	self.args = args
	import onnx

	model_path = "./model.onnx"
	fixed_model_path = model_path.replace(".onnx", ".fixed.onnx")

	# # Load the ONNX model which should have last layer as Sigmoid.
	# LGBM Models may sometime not add the Sigmoid op during export when using regression loss
	onnx_model = onnx.load(model_path)
	print(onnx_model)
	onnx.checker.check_model(onnx_model)
	from IPython.display import display, HTML

	class DisplayEntities:
	@classmethod
	def display(cls, texts, grouped_entities):
	html = []
	html.append(cls.get_style())
	for text, entities in zip(texts, grouped_entities):
	html.append(cls.show_entities(text, entities))
	display(HTML("".join(html)))
	import functools

	import pandas as pd
	import torch
	import transformers
	from accelerate import Accelerator
	from datasets import Dataset
	from torch.utils.data import DataLoader
	from tqdm.auto import tqdm
	import asyncio
	import logging
	import random
	import time
	from dataclasses import dataclass
	from typing import Any

	from tqdm.auto import tqdm

	logger = logging.getLogger(__name__)
	from datasets import load_dataset, Dataset, DatasetDict
	from sentence_transformers.losses import CosineSimilarityLoss
	from sentence_transformers import SentenceTransformer

	from setfit import SetFitModel, SetFitTrainer, sample_dataset
	from sklearn.model_selection import train_test_split
	import pandas as pd
	import numpy as np
	import json