最短路径问题是图论研究中的一个经典算法问题,旨在寻找图(由结点和路径组成的)中两结点之间的最短路径。算法具体的形式包括:
机器学习算法系列(32):MapReduce执行流程详解
数据结构与算法(13):深度优先搜索和广度优先搜索
BFS和DFS是两种十分重要的搜索算法,BFS适合查找最优解,DFS适合查找是否存在解(或者说能找到任意一个可行解)。用这两种算法即可以解决大部分树和图的问题。
机器学习算法系列(31):在线最优化求解(online Optimization)
转载自冯扬《在线最优化求解》
最优化求解问题可能是我们在工作中遇到的最多的一类问题了:从已有的数据中提炼出最适合的模型参数,从而对未知的数据进行预测。当我们面对高维高数据量的场景时,常见的批量处理的方式已经显得力不从心,需要有在线处理的方法来解决此类问题。本文以模型的稀疏性作为主线,逐一介绍几个在线最优化求解算法,并进行推导,力求讲清楚算法的来龙去脉,以及不同算法之间的区别和联系,达到融会贯通。在各个算法原理介绍之后,都给出该算法的工程实现伪代码,可以用于实际工作的参考。
数据结构与算法(12):排序
经典排序算法在面试中占有很大的比重,也是基础,在这里整理并用Java实现了几大经典排序算法,包括冒泡排序、插入排序、选择排序、希尔排序、归并排序、快速排序、堆排序、同排序。我们默认将一个无序数列排序成由小到大。
数据结构与算法(11):哈希表
一、哈希表的基本概念
哈希表(Hash Table)是一种特殊的数据结构,它最大的特点就是可以快速实现查找、插入和删除。因为它独有的特点,Hash表经常被用来解决大数据问题,也因此被广大的程序员所青睐。
数据结构与算法(10):查找
机器学习算法系列(30):Scikit-Learn总结
http://ff120.github.io/2017/05/14/机器学习专题/机器学习_Scikit-Learn使用技巧/
Scikit-learn是一个很受欢迎的机器学习方面的python工具包,它定义的一些范式和处理流程影响深远,所以,了解这个工具包对于机器学习算法的整个流程会有一个整体的了解。它已经实现了很多方法帮助我们便捷的处理数据,例如,划分数据集为训练集和验证集,交叉验证,数据预处理,归一化等等。
数据结构与算法(9):Trie树
Trie树是一种非常重要的数据结构,它在信息检索,字符串匹配等领域有广泛的应用,同时,它也是很多算法和复杂数据结构的基础,如后缀树,AC自动机等,因此,掌握Trie树这种数据结构,对于一名IT人员,显得非常基础且必要!
机器学习算法系列(29):Sparsity and Some Basics of L1 Regularization
转载自pluskid的个人博客
Sparsity 是当今机器学习领域中的一个重要话题。John Lafferty 和 Larry Wasserman 在 2006 年的一篇评论中提到: