1. 选择镜像
这里选择基础镜像时是有讲究. 一是应当尽量选择官方镜像库里的基础镜像;二是应当选择轻量级的镜像做底包.
就典型的 Linux 基础镜像来说,大小关系如下:Ubuntu > CentOS > Debian> Alpine
Alpine Docker 镜像也继承了 Alpine Linux 发行版的这些优势。相比于其他 Docker 镜像,它的容量非常小,仅仅只有 5 MB 左右(对比 Ubuntu 系列镜像接近 200 MB),且拥有非常友好的包管理机制apk。
2. 拷贝文件
相对于 ADD,优先使用 COPY指令
另外发现拷贝文件夹是把文件夹的内容拷贝进去, 而不是把整个目录拷贝进去, 坑爹 最后使用dockerignore解决这个问题.
1 | copy . /zk8/ |
.dockerignore文件
1 | chromedriver |
3. 测试 dockerfile
3.1 镜像加速
在本地测试的时候, 发现连Alpine都拉取不下来, 此处感谢伟大的 great wall. 于是选择阿里云加速.
https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors
右键点击桌面顶栏的 docker 图标,选择 Preferences ,在 Daemon 标签(Docker 17.03 之前版本为 Advanced 标签)下的 Registry mirrors 列表中
将 https://xxxxxxxxx.mirror.aliyuncs.com 加到 “registry-mirrors” 的数组里,点击Apply & Restart 按钮,等待 Docker 重启并应用配置的镜像加速器。
ps: 就是阿里云加速, 在后续的安装软件中也是特别慢, 此处建议在云服务器上(免费的谷歌云)操作.
3.2 测试
1 | docker build -t zk8:0.1 . # 制作 image |
前期可以通过 shell 进入到容器里面测试, 在里面尝试安装相应的软件包, 然后再写 dockerfile会比较方便
4. 安装软件包
爬虫用 python 写的, 并且使用了 selenium + 无头浏览器. 所以安装包要写在 dockerfile里, 文件如下:
1 | FROM alpine |
5. 发布到 dockerhub
建议建立自己的私有仓库, 因为 dockerhub 可以免费使用一个私有仓库, 此处上传到 dockerhub.
1 | docker login # 登录自己的 dockerhub 帐号 |
dockerhub 上还可以 link 到github, 即 github 一更新代码就重新 build.
接下来就是激动人心的时刻, 在任何安装 docker 的机器上直接运行自己的爬虫.
1 | docker pull levonfly/zk8:0.1 |