Java统计一篇文章中每个字符出现的个数

大家可以参考下面代码,有什么疑问请留言。。。

import java.io.BufferedReader;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collection;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.HashSet;
import java.util.List;
import java.util.Map;
import java.util.Set;

public class CountTheTimesOfCharsAppear {
    private static final String filePath = "\\String.txt";

    public static void main(String[] args) {

        Long start = System.nanoTime();
        //读取文件
        BufferedReader bReader = null;
        StringBuffer sBuffer = null;

        try {

            bReader = new BufferedReader(new InputStreamReader(new FileInputStream(filePath), "UTF-8"));

            sBuffer = new StringBuffer();

            String line = null;
            while ((line = bReader.readLine())!=null) {

                sBuffer.append(line);

            }

        } catch (Exception e) {
            // TODO: handle exception
            e.printStackTrace();
        }finally {

            if (bReader != null) {
                try {
                    bReader.close();
                } catch (IOException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
            }

        }

        String data = new String(sBuffer);

        data.trim();

        System.out.println("文件的内容===》"+data);

        System.out.println(data.length());

        //解析文本内容不统计所有文集或者字符出现的次数

        //对字符串中的字符进行去重
        String newData = RemoveDuplicateChar(data);

        System.out.println("文件的内容===》"+newData);
        System.out.println(newData.length());

        List<content> list = new ArrayList<>();
        //統計每個字符出現的次數
        for(int i=0; i< newData.length();i++) {
            int count = 0;
            for(int j = 0; j < data.length();j++) {

                if (newData.charAt(i)== data.charAt(j)) {

                    count++;
                }
            }

            list.add(new content(newData.charAt(i),count));
        }

        System.out.println(list);
        System.out.println(list.size());
        //根據字符出現的次數進行排序
        Collections.sort(list, new Comparator<content>() {

            @Override
            public int compare(content o1, content o2) {
                // TODO Auto-generated method stub
                return o2.getFrequency()-o1.getFrequency();
            }
        });

        System.out.println(list);
        System.out.println(list.size());

        Long end = System.nanoTime();

        System.out.println(end-start);
    }

    //对字符串中的字符进行去重
    /**
     * Return a String which doesn‘t contain repetitive characters
     * @param data this is the source String to remove the repetitive characters
     * @return String
     */
    public static String RemoveDuplicateChar(String s) {

        StringBuffer sb = new StringBuffer();
        int i=0;
        for(i=0; i<s.length();i++){
            char c=s.charAt(i);
            if(i==s.indexOf(c)) {
                 sb.append(c);
            }
        }
        return sb.toString();
    }

}

class content{

    private char key;
    private int frequency;
    public content(char key, int frequency) {
        super();
        this.key = key;
        this.frequency = frequency;
    }
    public Character getKey() {
        return key;
    }
    public void setKey(char key) {
        this.key = key;
    }
    public int getFrequency() {
        return frequency;
    }
    public void setFrequency(int frequency) {
        this.frequency = frequency;
    }
    @Override
    public String toString() {
        return "content [key=" + key + ", frequency=" + frequency + "]";
    }

}

原文地址:https://www.cnblogs.com/revel171226/p/8947527.html

时间: 2024-10-02 20:47:14

Java统计一篇文章中每个字符出现的个数的相关文章

N个任务掌握java系列之统计一篇文章中单词出现的次数

问题:统计一篇文章中单词出现的次数 思路: (1)将文章(一个字符串存储)按空格进行拆分(split)后,存储到一个字符串(单词)数组中. (2)定义一个Map,key是字符串类型,保存单词:value是数字类型,保存该单词出现的次数. (3)遍历(1)中得到的字符串数组,对于每一个单词,考察Map的key中是否出现过该单词,如果没出现过,map中增加一个元素,key为该单词,value为1(第一次出现): 如果,在map的key中发现了该单词,则通过key找到对应的value(单词出现的次数)

Python - 统计一篇文章中单词的频率

def frenquence_statistic(file_name): frequence = {} for line in open(file_name,'r').readlines(): words =line.strip().split(" ") for word in words: word = ''.join(list(filter(str.isalpha,word))).lower() if frequence.get(word) == None : frequence[

黑马程序员——统计一个字符串中各个字符出现的次数

统计一个字符串中各个字符出现的次数 import java.util.Iterator; import java.util.Set; import java.util.TreeMap; public class TreeMapDemo { //统计一个字符串中相应字符出现的次数 public static void main(String[] args) { // String s = "aagfagdlkerjgavpofjmvglk我是你的"; //调用自定义方法来 统计相应字符出

统计一个文件中出现字符&#39;a&#39;的次数

# -*- coding: utf-8 -*- #python 27 #xiaodeng #统计一个文件中出现字符'a'的次数 #http://www.cnblogs.com/hongten/p/hongten_python_count.html import os number=0 def getNumber(filePath,c): 'c---->the word numbers' #统计一个文件中出现字符'a'的次数 if os.path.exists(filePath): global

Excel 2010 如何快速统计一列中相同数值出现的个数

https://jingyan.baidu.com/article/9113f81b2c16822b3214c785.html 最近经常看到论坛和百度知道的朋友提问关于"excel中如何快速统计一列中相同数值出现的个数",看来这是个普遍问题.所以,笔者单独写一篇经验分享一下该问题的快速解决方案.数据如下图,A2:A51为人名数据,有重复,需统计每个人出现了多少次. 工具/原料 Excel 数据透视表解决方案: 1 首先,选中A1:A51的数据范围,选择[插入]-[数据透视表]. 2 按

统计01矩阵中全1子矩阵的个数

统计01矩阵中全1子矩阵的个数 1.51Nod 1291 题意:600*600的01矩阵,统计宽i高j的全1矩阵的个数. 题解:枚举矩阵的下边界,对于每个下边界,统计所有宽极大的矩形的答案(高度可以用差分).\(n^2\) 统计完之后,我们已知所有高度的宽极大的答案,列一下式子发现两次前缀和就是最后答案. 代码: #include<bits/stdc++.h> using namespace std; #define fi first #define se second #define mp

Java编程练习之判断Java文件名是否正确,判断邮箱格式是否正确和统计指定字符串中某字符现的次数

一判断Java文件名是否正确,判断邮箱格式是否正确 功能:判断Java文件名是否正确,判断邮箱格式是否正确.其中:合法的文件名应该以.java结尾:合法的邮箱名 中至少要包含 "@" , 并要求 "@" 在 "." 之前. 练习代码: public class Test { public static void main(String[] args) { //Java文件名 String fileName = "HelloWorld.j

计算一个字符串中每个字符出现的个数

需求:计算一个字符串中每个字符出现的次数 分析: 使用Scanner获取用户输入的字符串 创建Map集合,Key是字符串中的字符,value是字符的个数 遍历字符串,获取每一个字符 使用获取的字符,去Map集合判断key是否存在 key存在:通过字符(key),获取value(字符个数)value++ put(key,value )把新的value存储到Map集合中 key不存在:put(key,1) 遍历Map集合,输出结果 package day13; import java.util.Ha

JAVA:一篇文章理清多态

很多人总是喜欢,或者说错误地将JAVA中的多态理解得很复杂,最常见的错误说法就是所谓"方法的多态",他们会给出类似下面的例子来佐证"多态是指方法的多态": 复制代码 //Enginner和Mechanic是Employee的子类,构造函数参数均为月薪salaryEmployee a=new Enginner(100);Employee b=new Mechanic(100); //getAnnualSalary是Employee类的方法,用于计算并返回年薪Syste