自学中心

神经网络编程入门

27

xsmile 发布于 2017-03-26

  本文主要内容包括: (1) 介绍神经网络基本原理,(2) AForge.NET实现前向神经网络的方法,(3) Matlab实现前向神经网络的方法 。 第0节、引例  本文以Fisher的Iris数据集作为神经网络程序的测试数据集。Iris数据集可以在http://en.wik...

阅读(115)评论(0)赞 (0)

机器学习中的相似性度量

24

xsmile 发布于 2017-03-26

from http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html 在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Dist...

阅读(475)评论(0)赞 (0)

文本分类与SVM

9

xsmile 发布于 2017-03-16

from http://blog.csdn.net/zhzhl202/article/details/8197109 之前做过一些文本挖掘的项目,比如网页分类、微博情感分析、用户评论挖掘,也曾经将libsvm进行包装,写了一个文本分类的开软软件Tmsvm。所以这里将之前做过一些关...

阅读(165)评论(0)赞 (0)

PostgreSQL 性能优化

xsmile 发布于 2017-03-10

from http://blog.sina.com.cn/s/blog_681cd80d0100md5o.html postgresql 优化与维护 1. 硬件 数据库最重要的就是 I/O了。所以一切从I/O开始。 RAID: 这个基本不用说,数据库放RAID10上面,只读的备份...

阅读(213)评论(0)赞 (1)

常见机器学习方法总览

48

xsmile 发布于 2017-03-08

原文链接:http://www.chinakdd.com/article-oyU85v018dQL0Iu.html 朴素贝叶斯 1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单...

阅读(653)评论(0)赞 (1)

数据可视化

24

xsmile 发布于 2017-03-08

from http://blog.sina.com.cn/s/blog_7ed6001f0102x1vh.html 1、数据可视化概述 1.1、数据可视化的作用     数据可视化是指将数据通过图表的方式传递出来,让用户能够快速、准确地理解信息所要表达的内容,从而提高沟通效率。数...

阅读(450)评论(0)赞 (1)

Postgresql数据库的一些字符串操作函数

xsmile 发布于 2017-03-06

今天做项目遇到客户反映了一个麻烦的事情,有一些数据存在,但就是在程序中搜索不出来,后来分析,发现问题为数据前面有几个空白字符,后来用SQL查询了一下,发现八九个数据表中,数千万条数据中有将近三百万条数据存在相同的问题,本想着在查询时添加匹配符’%’,后来试...

阅读(158)评论(0)赞 (0)

PostgreSQL 性能调优

xsmile 发布于 2017-03-04

from http://www.mutouxiaogui.cn/blog/?p=413 批量导入性能优化 关闭自动提交 在批量插入数据时,如果每条数据都被自动提交,当中途出现系统故障时,不仅不能保障本次批量插入的数据一致性,而且由于有多次提交操作的发生,整个插入效率也会受到很大的...

阅读(189)评论(0)赞 (0)

使用sklearn优雅地进行数据挖掘

18

xsmile 发布于 2017-03-04

from http://www.cnblogs.com/jasonfreak/p/5448462.html 目录 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 1.2 数据初貌 1.3 关键技术 2 并行处理 2.1 整体并行处理 2.2 部分并行处理 3 流水线处...

阅读(329)评论(0)赞 (2)

postgresql—-COPY之表与文件之间的拷贝

2

xsmile 发布于 2017-03-02

from http://www.cnblogs.com/alianbog/p/5621660.html postgresql提供了COPY命令用于表与文件(和标准输出,标准输入)之间的相互拷贝,copy to由表至文件,copy from由文件至表。 示例1.将整张表拷贝至标准输...

阅读(134)评论(0)赞 (0)

一天搞懂深度学习

187

xsmile 发布于 2017-03-01

深度学习 ( Deep Learning ) 是机器学习 ( Machine Learning ) 中近年来备受重视的一支,深度学习根源于类神经网络 ( Artificial Neural Network ) 模型,但今日深度学习的技术和它的前身已截然不同,目前最好的语音识别和影...

阅读(384)评论(1)赞 (1)

修改postgres密码

xsmile 发布于 2017-03-01

阅读目录 1. 修改PostgreSQL数据库默认用户postgres的密码 2. 修改linux系统postgres用户的密码 1. 修改PostgreSQL数据库默认用户postgres的密码 PostgreSQL数据库创建一个postgres用户作为数据库的管理员,密码随机...

阅读(112)评论(0)赞 (0)

淘宝吴雪军:自然语言处理技术在搜索和广告中的应用

1

xsmile 发布于 2017-02-25

本文为淘宝广告技术部广告算法负责人、淘宝网研究员吴雪军在8月3日CTO俱乐部沙龙演讲实录,全文如下: 我今天演讲的题目是自然语言处理技术在搜索和广告中的应用。搜索和广告是技术非常密集两个互联网产品,它们前端都非常简单,但后台系统架构极其复杂。 今天主要讲三个方面的内容:第一、主要...

阅读(332)评论(0)赞 (1)

Python 的十个自然语言处理工具

xsmile 发布于 2017-02-25

from http://www.kawabangga.com/posts/1264 1.NLTK NLTK 在使用 Python 处理自然语言的工具中处于领先的地位。它提供了 WordNet 这种方便处理词汇资源的接口,以及分类、分词、词干提取、标注、语法分析、语义推理等类库。 ...

阅读(423)评论(1)赞 (0)