wget 下载云诺网盘文件
source link: https://blog.lilydjwg.me/2012/10/12/use-wget-to-download-yunio-files.35911.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
wget 下载云诺网盘文件
本文来自依云's Blog,转载请注明。
今天下载别人在云诺网盘上分享的文件,无奈网络太差,火狐才下了不到百分之一就认为下载完成了。每当这个时候,我便会祭出「中国特色网络」下的下载利器——wget。每当浏览器下不好文件时,wget 总会不屈不挠地一次次坚持,直到文件真正下载完成。
不过,这次对付云诺这个互联网友好发展的阻碍者时出现了问题。wget 总是下载到那个网页,即使指定 UserAgent 或者 Cookie 也没用。后来经过我不懈地尝试,发现指定Referer
即可,例如:
另外,要取得正确的文件名,需要使用--content-disposition
选项。不过,可能还需要使用ascii2uni -a J
来处理百分号转义。下边是我的~/.wgetrc
:
# 不要乱转义中文
--restrict-file-names=nocontrol
# 使用重定向后的文件名
--trust-server-names=on
--content-disposition=on
9 年前
初见wget的时候完全没想到这是神器啊(笑)
偶扒站用的wget命令放在.zshrc里面:
alias wget1='wget -r -c -np --remote-encoding=en_US.utf-8 --local-encoding=en_US.utf-8'
alias wget2='wget1 --execute=http_proxy=localhost:8087 '
9 年前
你想想,通过云诺给好友分享了一张截图。好友要看到这张截图需要怎么办呢?
首先,需要开启一个现代浏览器。这个一般还好。
其次,需要载入6个CSS文件和9个JavaScript文件。共计650KiB左右。网页设计的原则是,对用户重要的内容率先载入。而云诺,在载入这么多毫不相干的东西之后才会显示你真正需要的东西。而天朝的网络你懂的。
最后,不给出指向原始文件的 URL,不能直接使用下载工具下载。这不便于在脚本/命令行中使用。(比如你在安装 Linux 系统,需要网上的某个文件(比如辛辛苦苦找到别人分享的驱动补丁)才能进入图形界面。如果它在 dropbox 里,w3m 即可下载之。如果在云诺,除非你事先知道或者人脑解析网页代码,不然你没办法把东西下回来。)
8 年前
嗨,我是来自python-cn和TJLUG的, 看到你这篇post.想起我已经用了有一段时间自己写的一点东西,就是为了解决wget和浏览器header/cookies配合的script.
在这,喜欢可以拿去用:) 迅雷离线/youtube测试完全没问题, 我用得最多的2项.
https://gist.github.com/4155207
8 年前
wget的--content-disposition选项虽然能取得正确的文件名,但是和-c选项好像不能很好的配合。
wget的断点续传好像是通过url地址最后的文件名或者-O选项指定的文件名来判断的。
上次好不容易下载下来的一个文件,一续传又重头开始下载了。
不知道博主有没有好的解决办法。
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK