NLPchina
diff --git a/‎README.md
Lines changed: 3 additions & 0 deletions b/‎README.md
Lines changed: 3 additions & 0 deletions
diff --git a/‎src/main/java/org/ansj/app/crf/SplitWord.java
Lines changed: 0 additions & 1 deletion b/‎src/main/java/org/ansj/app/crf/SplitWord.java
Lines changed: 0 additions & 1 deletion
diff --git a/‎src/main/java/org/ansj/app/web/AnsjServlet.java
Lines changed: 7 additions & 1 deletion b/‎src/main/java/org/ansj/app/web/AnsjServlet.java
Lines changed: 7 additions & 1 deletion
diff --git a/‎src/main/java/org/ansj/dic/LearnTool.java
Lines changed: 0 additions & 4 deletions b/‎src/main/java/org/ansj/dic/LearnTool.java
Lines changed: 0 additions & 4 deletions
@@ -64,6 +64,9 @@ https://github.com/ansjsun/mvn-repo/tree/gh-pages/org/ansj/tree_split
 ----
 ##大事记要
 
+#2014年1月21日
+* 增加了crf模型的解析。用crf来做未登录词的识别。取得了不错的效果，增加了对长词的进一步解析。将颗粒度防到最低。但是随之而来的影响造成了。分词jar包过大。大约有500多m，无法很顺利发布到git 和 maven库中。试了oschina的maven库也是不可以。如果没有很好的方案。ansj决定放弃maven支持。对于这方面需求的朋友只能说非常抱歉了。我不想因为担心项目的庞大。而畏首畏尾。当然对于jar包的发布可能选择云盘的方案。对于用于搜索的朋友。不建议跟着更新。因为index分词没有作更多的改变。祝好。剩下今年的时间（阴历），有下面几个打算。重构代码。优化里面的关键性算法。完善文档。随缘
+
 #2013年12月12日
 * 把由字构词的方式加到了分词中，对未登录词有了很大的提高。对外国人名的识别做了特定的优化。目前正在测试中。新增了httpserver 的控制台。可以直接方便调用分词结果
 
 
@@ -35,7 +35,6 @@ public class SplitWord {
      */
     public SplitWord(Model model) {
 	this.model = model;
-
 	tagConver = new int[model.template.tagNum];
 	revTagConver = new int[model.template.tagNum];
 	Set<Entry<String, Integer>> entrySet = model.template.statusMap.entrySet();
 
@@ -16,7 +16,7 @@
 public class AnsjServlet {
 
     private enum AnsjMethod {
-        TO, NLP, BASE, KEYWORD ,INDEX
+        TO, NLP, BASE, KEYWORD ,INDEX ,MIN_NLP
     }
 
     public static String processRequest(String input, String strMethod, String strNature)
@@ -40,6 +40,12 @@ public static String processRequest(String input, String strMethod, String strNa
             case NLP:
                 terms = NlpAnalysis.parse(input);
                 break;
+            case MIN_NLP:
+                terms = NlpAnalysis.parse(input);
+                String str = terms.toString() ;
+                if(str.length()>4){
+                    return str.substring(1,str.length()-2) ;
+                }
             case KEYWORD:
                 KeyWordComputer keyWordComputer = new KeyWordComputer(10);
                 keyWords = keyWordComputer.computeArticleTfidf(input);
 
@@ -47,10 +47,6 @@ public class LearnTool {
      * @param graph
      */
     public void learn(Graph graph) {
-        // 机构名识别
-//        if (isCompany) {
-//            findCompany(graph);
-//        }
 
         // 亚洲人名识别
         if (isAsianName) {