Skip to content

Instantly share code, notes, and snippets.

View hewumars's full-sized avatar

Mars hewumars

View GitHub Profile
@hewumars
hewumars / readme.md
Last active December 10, 2020 07:15
  1. 获取PID进程的内存信息 pmap -x ${pid} | sed 's/[//;s/]//' | grep rw | awk '{total[$7]+=$2}END{for(v in total){print total[v],v}}' | sort -n
  2. 查看进程内存 cat /proc/${pid}/status
  3. 系统内存信息 cat /proc/meminfo
  4. ffmpeg -i test.mp4 -vcodec h264 -bf 0 -g 25 -r 10 -s 1280*720 -an -f h264 test1.264 //-bf B帧数目控制,-g 关键帧间隔控制, -s 分辨率控制 -an关闭音频,-r 指定帧率
  5. gcc编译器预定义宏 gcc -dM -E -x c /dev/null
  6. 查看程序编译器版本 objdump -s --section=.comment your_program
  7. 写硬盘速度 time dd if=/dev/zero of=/tmp/test bs=8k count=1000000
  8. 读硬盘速度 time dd if=/tmp/test of=/dev/null bs=8k
  9. 读写ddr速度 -n 10表示运行10次,256表示测试所用的内存大小,单位为MB apt-get install mbw mbw -q -n 10 256
  10. 新建用户及用户管理
#兼容新旧gcc版本,添加宏定义
if(CONAN_LIBCXX STREQUAL "libstdc++11")
add_definitions(-D_GLIBCXX_USE_CXX11_ABI=1)
elseif(CONAN_LIBCXX STREQUAL "libstdc++")
add_definitions(-D_GLIBCXX_USE_CXX11_ABI=0)#gcc版本高于5时需要,才能链接opencv库
endif()
#添加编译选项
add_compile_options(-fPIC)
@hewumars
hewumars / readme.md
Last active November 10, 2020 10:08

在设计轻量级网络时,FLOPs和模型参数是主要考虑因素,但是减少模型大小和FLOPs不等同于减少推理时间和降低能耗。比如ShuffleNetv2与MobileNetv2在相同的FLOPs下,前者在GPU上速度更快。所以除了FLOPs和模型大小外,还需要考虑其他因素对能耗和模型推理速度的影响。这里考虑两个重要的因素:内存访问成本(Memory Access Cost,MAC)和GPU计算效率。

@hewumars
hewumars / 1.md
Last active November 5, 2020 09:28

python常用操作: sorted(query,key=lambda x:x[1]) 用于元组排序,数组序号用于指定元组第几个元素排序

索引方法 latency time mean average precision 0.65 false alarm rate
FLAT
IVF_FLAT
IVF_SQ8
IVF_SQ8H
IVF_PQ
RNSG
HNSW
ANNOY
@hewumars
hewumars / readme.md
Last active October 9, 2020 01:42
pytorch分布式训练

https://blog.csdn.net/weixin_39718268/article/details/105021631

python -m torch.distributed.launch --nproc_per_node=NUM_GPUS main.py [--arg1 --arg2 ...]

# 1) 初始化
torch.distributed.init_process_group(backend="nccl")
# 2) 配置每个进程的gpu
local_rank = torch.distributed.get_rank()
print('local_rank:{}'.format(local_rank))

torch.cuda.set_device(local_rank)

@hewumars
hewumars / 1.md
Last active September 24, 2020 10:37

项目实施

项目启动前准备

项目概述

项目需求清单

@hewumars
hewumars / 1.md
Last active September 23, 2020 02:37

TensorRT版本性能差异测试ResNet50.onnx

模型-耗时ms/张 TRT7.1.3.4 TRT5.1.5.0 版本性能提升
ResNet50-b1-fp32-Nvidia2080Ti 2.0444 2.3022 11.20%
ResNet50-b4-fp32 0.6491 1.1063 41.32%
ResNet50-b8-fp32 0.3533 0.8849 60.07%
ResNet50-b16-fp32 0.2037 0.7502 72.85%
ResNet50-b1-int8 0.72
@hewumars
hewumars / 1.md
Last active September 22, 2020 10:34

需要:

  1. 批判性思维
  2. 跨学科见识
  3. 擅长处理人际关系

项目管理是什么

  1. 达成目标的能力
  2. 目标落地的方法

知识knowledge---记忆、技能skill---练习、态度attitude---用心,感悟

We couldn’t find that file to show.