这里是黄永亮的博客

本地虚拟机远程桌面穿透内网

1.注册花生壳账号。http://hsk.oray.com/
2.登录路由器配置界面。
3.绑定虚拟机网卡MAC和IP。
4.添加转发规则,把3389端口转发到外网。
5.配置花生壳账户,启用DDNS。
6.把自己的子域名加CNAME解析记录指向花生壳的动态域名。
7.更改虚拟机网卡设置,改成桥接模式。
8.更改系统设置,允许远程桌面访问。
9.开启Windows防火墙,配置规则。
10.关掉虚拟机和主机之间的所有共享文件夹。
这样在公网上即可使用自定义的域名连接家里的虚拟机了。

数据结构——线性结构

终于可以开始填这个坑了233333 ———————————— 像上一篇文章说的数据结构要解决的问题是数据如何在内存中存储,以什么结构存储。 用张仰森老师的话来说,就是“数据以及数据之间的关系。” 今天主要要聊的就是线性结构。 这里说的线性结构,是指从逻辑结构上来划分的。 说到这,就不得不提下物理结构。所谓逻辑结构,就是在逻辑、理论上定义的结构,而物理结构是指在实际的内存中数据的存储结构。 比如,有这么一种结构,每个元素只有唯一的前驱、唯一的后继、 ...

CDH5性能调优

为了增加pipeline的运算速度,所以利用集群来进行日志的分析统计。测试数据规模:某机构edX的D版在真实场景下一年多使用记录。 开始日期 2016/11/27 开始时间 2:26:00 结束日期 2016/11/28 结束时间 3:34:00 总时间 23:10:54 日志开始日期 2015/6/7 日志结束日期 2016/11/24 在没有任何设置的情况下,运行完所有任务的时间如上表。。。。将近一天的时间=-=太慢了。 经过不断的尝试、分析如下: 慢的原因是每个任务都会有很多的map和reduce任务生成、而每个mapreduce任务都会占用一个worker节点的容器、每个服务器能申请到的容器数量和 ...

Linux常用软件(更新ing)

是的=-=我又来挖坑了。。争取慢慢填233333 本文记录Ubuntu Linux下比较好用的软件 软件大部分可以通过apt-get install命令安装,如果你在校内,建议更换清华源(参考基本配置:http://blog.hylstudio.cn/archives/452),如果在校外可以用网易源。 之前还几篇可以参考。。之后会写的更详细的=-=嗯,相信我,一定会写的   Linux常用命令备忘录(更新ing)   Linux笔记1(Linux运维、大数据相关工具) Linux笔记2(Linux运维、大数据相关工具) XShell 远程终端,可以同步操作N个终端,在懒得写ansible的时候简直是神器 git 先继续 ...

CDH5使用准备

前言 本次搭建CDH主要用于edX的数据分析,用于安装pipeline加快运算速度。 架构设计 3+N结构,3台主机负责HDFS主节点、CDH自身服务、YARN的ResourceManager等主要服务。 其他N台负责HDFS的NameNode和YARN的NodeManager,承担计算任务。现初步设计为6台、即3+3 硬件配置 主节点 CPU:双核E5*4 内存:16G 工作节点 CPU :双核E5*4 内存:16G 操作系统 Ubuntu 14.04 64位 准备工作 hostname、hosts 每台hostname统一前缀,我写的是hadoop。域名有dns的情况下使用dns更方便。 sudo vim /etc/hostname sudo vim /etc/hosts 127. ...

es分词引擎

计科的同学做实验如果需要分词可以试用下这个分词引擎。 github地址https://github.com/huaban/elasticsearch-analysis-jieba es官方文档https://www.elastic.co/guide/en/elasticsearch/reference/2.3/getting-started.html 地址http://es.hylstudio.cn/jieba 接口说明 index 主要用于索引分词,分词粒度较细 search 主要用于查询分词,分词粒度较粗 返回json中的index为字符序号,从0开始,左闭右开。   接口地址 http://es.hylstudio.cn/jieba/_analyze?analyzer=jieba_index 请求方法 POST 请求示例 {“text”:& ...