sshuair's note

CNN中的卷积操作

Deep Learning
Convolution输出大小计算公式一个图像经过卷积核之后输出图像的大小计算公式: $$ size_{out} = floor [ \frac{size_{in} + 2 \ast padding - dilation \ast (kernel\ size - 1) - 1)} {str ...
Read more

PyTorch中的Loss Fucntion

Deep Learning PyTorch

深度学习中的Loss Function有很多,常见的有L1、L2、HingeLoss、CrossEntropy,其最终目的就是计算预测的 $f(x)$ 与真值 $y$ 之间的差别,而优化器的目的就是minimize这个差值,当loss的值稳定后,便是$f(x)$ 的参数$W$最优的时候。不同的Loss Function适用场景不同,各个深度学习框架实现大同小异,这里用PyTorch来对常见的Loss Function进行阐述。这里先构造一个预测值$\hat{y}$ 和真值 $y$

Read more

深度学习docker环境搭建

Deep Learning Docker GIS

在平时的机器学习和深度学习的工作中,虽然在mac os上用brew配置各种机器学习、深度学习以及地理相关的开发环境比较容易,但是公司的linux上又是另一套安装方法,略显麻烦,对于新来的同事或者实习生也得手把手教一遍配置各种包库,不仅浪费时间,而且新手很容易把环境搞崩掉。平台组的同事已近把docker用于开发中,那么我们是不是也可以把机器学习、深度学习的开发环境打包到docker中呢?当然是可以的,TensorFlow、pytorch、caffe等深度学习框架都有自己的官方docker image,虽然可以分开用,但是我们还要用到sk-learn、sk-image、pandas、gdal等其它工具,所以把这些都打包到一个image中不仅用着方便,不用每次在各个docker image之间切换,还能减少总的image的大小,更有助于提高工作效率,不用浪费大量的时间再各种环境的配置上面,真正做到了一次打包四处开发的效果。

Read more

不同learning rate比较

Deep Learning PyTorch

在SGD优化中,通常要设置一个learning rate(lr),这个lr 太大不好,太小也不好,太大容易越过最低点而无法下降,太小了收敛太慢

在cifar10数据集上,尝试了一下lr:[10, 5, 1, 0.1, 0.01, 0.001, 0.0001, 0.00001],每种lr进行了1000个epoch迭代,网络使用了较为简单的LeNet网络。

从训练结果来看,lr=10lr=5 这种特别大的lr情况下,在第一个epoch中前面几十个batchloss就会暴涨,超过最大值,最终出现NAN的情况。

Read more

kaggle入门之旅:house prices

kaggle machine learning

最近的工作内容一直围绕着机器学习展开,断断续续看了不少教程,这里正好拿着kaggle的House Prices: Advanced Regression Techniques练练手,总结一下机器学习的大致流程。

Data Exploration

看了许多教程和机器学习的经验,都提到过一句话:搞机器学习,对数据和业务的认识很重要,所以下面就先来看看数据长什么样子,以及数据可视化中常用的方法和工具,python中数据的读取以及处理的瑞士军刀非pandas莫属,而可视化有matplotlib和seaborn两个方便的工具

Read more

PostGIS中的Geometry相互关系

GIS PostGIS

在二维地理对象中,两两实体之间的关系可以用三种关系表达:

  • Interior:包含,一个物体在另一个物体中,并且边界不相交
  • Exterior:相离,两个物体谁也不触碰谁
  • Boundary:相切,两个物体既不包含也不相离

那么在PostGIS中intersection如何定义呢?即两个相交的对象,其两者之间的关系必然是interior或者boundary,并且有共同的点,这些共有的点就是相交部分。

Read more

中国,条条大路通哪里?

Maps

古语有云:All Roads Lead to Rome, 我们利用GeoHey提供的最短路径API制作了中国版的条条大陆通北京、上海、广州、武汉、成都,以及每个省到自己省会的条条大路通罗马图。全国每隔0.1个经纬度(大约11km)采一个点作为起点,共计96442个起点,每个起点都会生成一条最短路径,重复越多的路径,其线越粗、颜色也越深。在线地图地址:roads to rome

北京

beijing_3360x2100

Read more

中国村名尾字分布图

Maps

中国村名尾字分布图,列举了主要的几个字,包括:

注:尾字图表示以*字结尾的分布图,例如王庄,就是以结尾。

村

Read more

Hello World

hexo install 123456npm install hexo-cli -ghexo init blogcd blognpm installhexo servernpm install hexo-deployer-git --save 数学公式支持:npm install he ...
Read more