Skip to content

Instantly share code, notes, and snippets.

View hewumars's full-sized avatar

Mars hewumars

View GitHub Profile

注册一个算子需要三个步骤:

  1. 使用RELAY_REGISTER_OP宏注册算子的arity(实现函数)和type信息
  2. 定义c++函数去生成调用节点并注册python api钩子函数
  3. 封装上次python api钩子函数的接口
  1. 转换时注意不要有double()算子,因为trt不支持float64
    # export dynamic shape onnx  TensorRT动态输入
    x = torch.randn(4, 3, 256, 256, requires_grad=True).cuda()
    res = net(imgs=[x])
    torch.onnx.export(net,[x],"r2d2-0.onnx",opset_version=11)

    torch.onnx.export(net,                       # model being run
                      [x],                       # model input (or a tuple for multiple inputs)
  • VCM产品Atlas300DDK安装

1.本地
tar xzvf Ascend_DDK-接口版本-硬件架构.操作系统
python ddk_setup.py install /home/user /usr1 /home/user/Ascend_lib*.zip
/home/user:ddk安装的绝对路径,由用户指定。为了便于后面理解,假设ddk安装路径为$DDK_DIR
/home/user/Ascend_lib*.zip:Ascend_lib_xxx.zip(上图中ddk安装包)绝对路径

2.交叉 \

conda create -n caffe_gpu -c defaults python=3.6 caffe-gpu
#conda create -n caffe -c defaults python=3.6 caffe

《每天最重要的两小时》 给我们五个建议, 可以让在需要的时候,让自己达到最好的状态 第一: 关注停顿点, 谨慎选择自己的每一件事情, 第二:管理心理能量, 合理分配自己的精力, 第三:理解注意力的特点, 它不是每时每刻都可以保持高效状态的, 要学会顺应这个特点, 第四:掌控饮食和运动, 保持葡萄糖的稳定和保持轻量的运动,是获得好的状态的重要途径 第五:让环境为你服务, 注意噪音和光线的控制

对于深度学习推理,有5个用于衡量软件的关键指标:

  1. 吞吐量(Throuthput): 指定时间区间内的输出量,通常用inference/second 或者samples/second来度量;
  2. 效率(Efficiency):单位功率的吞吐量,通常用performance/watt来度量;
  3. 延迟(Latency):运行推理的时间,通常用ms度量;
  4. 精确度(Accuracy):训练过的神经网络给出正确结果的能力;
  5. 内存占用(Memory usage):主机和设备内存决定于所用的神经网络算法需要申请多少内存空间进行推理;

参考https://www.cnblogs.com/Zhi-Z/p/8728168.html https://img-blog.csdn.net/20170426204103808

  • 准确率(Accuracy)
vi /etc/sysconfig/network-scripts/ifcfg-* #网口配置文件
#IP地址
IPADDR="192.168.2.31"
#默认网关
GATEWAY="192.168.2.1"
#DNS服务器,至少一个
DNS="192.168.2.1"
#DNS服务器,可以配置多个
DNS="114.114.114.114"

存储器的速度是register > local memory >shared memory > global memory CUDA内存模型 Kernel上的两层线程组织结构(2-dim) 线程索引