storm实时处理结果的NoSQL保存

博主： zlhui
发布时间：2021 年 06 月 11 日
2401 次浏览
12565字数
分类：默认分类

哈尔滨理工大学

软件与微电子学院

实验报告

（2020-2021第二学期）

课程名称：	实时数据处理
班级:	软件18- 1 班
学号:	1814010130
姓名:	张立辉

哈尔滨理工大学软件与微电子学院

实验名称：	实验2 storm实时处理结果的NoSQL保存				专业	软件工程
姓名	张立辉	学号	1814010130		班级	软件18-1

一、实验目的：

理解大数据场景下数据处理和数据保存的结合，掌握Storm和Redis数据库的联合应用

二、实验内容：

在实验一的基础上，设计实时处理结果的键值模型，并定义一个Bolt完成实时处理结果的存储。
（1）任务一：保存词和词频数据
键值模型如下：
Word: frequency
定义VO类和接口：

public class WordFreq{
private String word;
private int freq;
private Date date; //以月为单位，比如2017-05-01
//setter  getter

}
public interface WordFreqDao{
public void saveWordFreq(WordFreq wf);
}

（2）任务二：保存词的联合频率
键值模型如下：
Word-word: frequency
定义VO类和接口：

public class BiWordFreq{
private String word1;
private String word2;
private Date date; //以月为单位，比如2017-05-01
private int freq;

//setter  getter

}
public interface BiWordFreqDao{
public void saveBiWordFreq(biWordFreq wf);
}

三、实验设备及软件环境：

Windows10专业版
IntelliJ IDEA 2020.3.2 (Ultimate Edition)
Java15

四、实验过程及结果截图：

BiWordFreq.java

package bean;

import java.util.Date;

public class BiWordFreq {
    private String word1;
    private String word2;
    private Date date;
    private int freq;

    public void setWord1(String word1) {
        this.word1 = word1;
    }

    public String getWord1() {
        return word1;
    }

    public void setWord2(String word2) {
        this.word2 = word2;
    }

    public String getWord2() {
        return word2;
    }

    public void setDate(Date date) {
        this.date = date;
    }

    public Date getDate() {
        return date;
    }

    public void setFreq(int freq) {
        this.freq = freq;
    }

    public int getFreq() {
        return freq;
    }

}

WordFreq.java

package bean;

import java.util.Date;

public class WordFreq {
    private String word;
    private int freq;
    private Date date;

    public void setWord(String word) {
        this.word = word;
    }

    public String getWord() {
        return word;
    }

    public void setFreq(int freq) {
        this.freq = freq;
    }

    public int getFreq() {
        return freq;
    }

    public void setDate(Date date) {
        this.date = date;
    }

    public Date getDate() {
        return date;
    }

}

FrequencyBolt.java

package bolt;

import java.util.Date;
import java.util.HashMap;
import java.util.Set;
import java.util.Map;

import org.apache.storm.task.OutputCollector;
import org.apache.storm.task.TopologyContext;
import org.apache.storm.topology.OutputFieldsDeclarer;
import org.apache.storm.topology.base.BaseRichBolt;
import org.apache.storm.tuple.Tuple;

import bean.WordFreq;
import dao.WordFreqDAO;

public class FrequencyBolt extends BaseRichBolt {
    private Map<String, Integer> wordFreq;

    @Override
    public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {
        // TODO Auto-generated method stub
        wordFreq = new HashMap<String, Integer>();
    }

    @Override
    public void execute(Tuple input) {
        // TODO Auto-generated method stub
        String word = input.getStringByField("word");
        if("".equals(word)) {
            System.out.println("词频：");
            System.out.println(wordFreq);
            System.out.println();

            Set<String> set = wordFreq.keySet();
            for(String s: set) {
                WordFreq wf = new WordFreq();

                wf.setWord(s);
                wf.setFreq(wordFreq.get(s));
                wf.setDate(new Date());

                new WordFreqDAO().saveWordFreq(wf);
            }
            return;
        }

        if(!wordFreq.containsKey(word)) {
            wordFreq.put(word, 1);
        }
        else {
            wordFreq.replace(word, wordFreq.get(word) + 1);
        }
    }

    @Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        // TODO Auto-generated method stub

    }

}

ParticipleBolt.java

package bolt;

import java.io.IOException;
import java.io.StringReader;
import java.util.Map;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.apache.storm.task.OutputCollector;
import org.apache.storm.task.TopologyContext;
import org.apache.storm.topology.OutputFieldsDeclarer;
import org.apache.storm.topology.base.BaseRichBolt;
import org.apache.storm.tuple.Tuple;
import org.apache.storm.tuple.Values;
import org.wltea.analyzer.lucene.IKAnalyzer;
import org.apache.storm.tuple.Fields;

public  class ParticipleBolt extends BaseRichBolt {
    OutputCollector collector;

    public void execute(Tuple arg0) {
        String content = arg0.getStringByField("content");

        if("".equals(content)) {
            collector.emit(new Values(""));
            return;
        }

        try(Analyzer analyzer = new IKAnalyzer(true);) {
            TokenStream stream = analyzer.tokenStream("content", new StringReader(content));
            CharTermAttribute cta = stream.addAttribute(CharTermAttribute.class);
            stream.reset();
            while (stream.incrementToken()) {
                collector.emit(new Values(cta.toString()));
            }
        }
        catch(IOException e) {
            e.printStackTrace();
        }
    }

    public void prepare(Map arg0, TopologyContext arg1, OutputCollector arg2) {
        collector = arg2;
    }

    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new Fields("word"));
    }

}

RelationBolt.java

package bolt;

import java.io.IOException;
import java.io.StringReader;
import java.util.ArrayList;
import java.util.Date;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Set;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.apache.storm.task.OutputCollector;
import org.apache.storm.task.TopologyContext;
import org.apache.storm.topology.OutputFieldsDeclarer;
import org.apache.storm.topology.base.BaseRichBolt;
import org.apache.storm.tuple.Tuple;
import org.wltea.analyzer.lucene.IKAnalyzer;

import bean.BiWordFreq;
import dao.BiWordFreqDAO;

public class RelationBolt extends BaseRichBolt {
    private Map<String, Integer> wordFreq;

    @Override
    public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {
        // TODO Auto-generated method stub
        wordFreq = new HashMap<String, Integer>();
    }

    @Override
    public void execute(Tuple input) {
        // TODO Auto-generated method stub
        String content = input.getStringByField("content");
        List<String> wordList = new ArrayList<String>();

        if("".equals(content)) {
            System.out.println("关联词频：");
            System.out.println(wordFreq);
            System.out.println();

            Set<String> set = wordFreq.keySet();
            for(String s: set) {
                BiWordFreq wf = new BiWordFreq();
                String[] words = s.split("-");

                wf.setWord1(words[0]);
                wf.setWord2(words[1]);
                wf.setFreq(wordFreq.get(s));
                wf.setDate(new Date());

                new BiWordFreqDAO().saveBiWordFreq(wf);
            }
            return;
        }

        try(Analyzer analyzer = new IKAnalyzer(true);) {
            TokenStream stream = analyzer.tokenStream("content", new StringReader(content));
            CharTermAttribute cta = stream.addAttribute(CharTermAttribute.class);
            stream.reset();
            while (stream.incrementToken()) {
                wordList.add(cta.toString());
            }
        }
        catch(IOException e) {
            e.printStackTrace();
        }

        for(int i = 0; i < wordList.size(); i++) {
            for(int j = i + 1; j < wordList.size(); j++) {
                String str1 = wordList.get(i);
                String str2 = wordList.get(j);
                String key = null;

                if(str1.compareTo(str2) == 0) {
                    continue;
                }
                else if(str1.compareTo(str2) > 0) {
                    key = str2 + "-" + str1;
                }
                else {
                    key = str1 + "-" + str2;
                }

                if(!wordFreq.containsKey(key)) {
                    wordFreq.put(key, 1);
                }
                else {
                    wordFreq.replace(key, wordFreq.get(key) + 1);
                }
            }
        }

    }

    @Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        // TODO Auto-generated method stub

    }

}

BiWordFreqDAO.java

package dao;

import bean.BiWordFreq;
import util.JedisUtil;

import redis.clients.jedis.Jedis;

public class BiWordFreqDAO {

    public void saveBiWordFreq(BiWordFreq wf) {
        try(Jedis jedis = JedisUtil.getConnection()) {
            String key = wf.getWord1() + "-" + wf.getWord2();
            int value = wf.getFreq();

            if(jedis.exists(key)) {
                jedis.set(key, String.valueOf(Integer.parseInt(jedis.get(key)) + value));
            }
            else {
                jedis.set(key, String.valueOf(value));
            }
        }
        catch(Exception e) {
            e.printStackTrace();
        }
    }

}

WordFreqDAO.java

package dao;

import bean.WordFreq;
import util.JedisUtil;

import redis.clients.jedis.Jedis;

public class WordFreqDAO {

    public void saveWordFreq(WordFreq wf) {
        try(Jedis jedis = JedisUtil.getConnection()) {
            String key = wf.getWord();
            int value = wf.getFreq();

            if(jedis.exists(key)) {
                jedis.set(key, String.valueOf(Integer.parseInt(jedis.get(key)) + value));
            }
            else {
                jedis.set(key, String.valueOf(value));
            }
        }
        catch(Exception e) {
            e.printStackTrace();
        }
    }

}

Spout.java

package spout;

import java.util.Map;

import org.apache.storm.spout.SpoutOutputCollector;
import org.apache.storm.task.TopologyContext;
import org.apache.storm.topology.OutputFieldsDeclarer;
import org.apache.storm.topology.base.BaseRichSpout;
import org.apache.storm.tuple.Values;
import org.apache.storm.tuple.Fields;

import redis.clients.jedis.Jedis;

import util.JedisUtil;

public class Spout extends BaseRichSpout  {
    private SpoutOutputCollector collector;

    public void nextTuple() {
        String content = JedisUtil.getConnection().get("!");
        String[] strs = content.split("\n");

        for(String s: strs) {
            collector.emit(new Values(s));
        }
        collector.emit(new Values(""));
        try {
            Thread.sleep(Long.MAX_VALUE);
        }
        catch(InterruptedException e) {
            e.printStackTrace();
        }
    }

    public void open(Map arg0, TopologyContext arg1, SpoutOutputCollector arg2) {
        collector = arg2;
    }

    public void declareOutputFields(OutputFieldsDeclarer arg0) {
        arg0.declare(new Fields("content"));
    }

}

zlh.java

package test;

import topology.TopologyFactory;
import util.JedisUtil;
import org.apache.storm.Config;
import org.apache.storm.LocalCluster;
import org.apache.storm.generated.StormTopology;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;

public class zlh {

    public static void main(String[] args) throws MalformedURLException, IOException {

        Document doc = Jsoup.parse(new URL("https://blog.csdn.net/weixin_45267419"), 50000);
        Elements titles = doc.select("h4");
        StringBuffer sb = new StringBuffer();

        for(Element title: titles) {
            sb.append(title.html() + "\n");
        }
        sb.delete(sb.length() - 1, sb.length());

        JedisUtil.getConnection().set("!", sb.toString());

        StormTopology topology = TopologyFactory.factory();

        LocalCluster cluster = new LocalCluster();

        Config config = new Config();

        cluster.submitTopology("1814010130", config, topology);

    }
}

TopologyFactory.java

package topology;

import org.apache.storm.topology.TopologyBuilder;
import org.apache.storm.generated.StormTopology;

import spout.*;
import bolt.*;

public class TopologyFactory {

    public static StormTopology factory() {
        TopologyBuilder builder = new TopologyBuilder();
        builder.setSpout("s1", new Spout());
        builder.setBolt("b1", new ParticipleBolt()).shuffleGrouping("s1");
        builder.setBolt("b2", new FrequencyBolt()).shuffleGrouping("b1");
        builder.setBolt("b3", new RelationBolt()).shuffleGrouping("s1");
        return builder.createTopology();
    }

}

JedisUtil.java

package util;

import redis.clients.jedis.Jedis;

public class JedisUtil {

    public static Jedis getConnection() {
//        return new Jedis("121.89.197.4", 6379);
        Jedis jedis= new Jedis("121.89.197.4", 6379);
        jedis.auth("root");
        return jedis;
    }

}

运行结果：

reids内容：

五、总结：

通过本次实验：理解大数据场景下数据处理和数据保存的结合，掌握Storm和Redis数据库的联合应用

实验成绩：指导教师：年月日

最后修改：2021 年 06 月 20 日

如果觉得我的文章对你有用，请随意赞赏

发表评论取消回复

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

storm实时处理结果的NoSQL保存

zlhui • 2021 年 06 月 11 日

<center><h1>哈尔滨理工大学</h1><h1>软件与微电子学院</h1><h1>实 验 报 告</h1><p>（2020-2021第二学期）</p><table><tbody><tr><td align="center">课程名称：</td><td align="left">实时数据处理</td></tr><tr><td align="center">班    级:</td><td align="left">软件18- 1 班</td></tr><tr><td align="center">学   号:</td><td align="left">1814010130</td></tr><tr><td align="center">姓   名:</td><td align="left">张立辉</td></tr></tbody></table><p>哈尔滨理工大学软件与微电子学院</p></center><hr><table><thead><tr><th align="center">实验名称：</th><th colspan="4" align="center">实验2 storm实时处理结果的NoSQL保存</th><th align="center">专  业</th><th align="center">软件工程</th></tr></thead><tbody><tr><td align="center">姓    名</td><td align="center">张立辉</td><td align="center">学  号</td><td colspan="2" align="center">1814010130</td><td>班  级</td><td>软件18-1</td></tr></tbody></table><h2>一、实验目的：</h2><p>理解大数据场景下数据处理和数据保存的结合，掌握Storm和Redis数据库的联合应用</p><h2>二、实验内容：</h2><p>在实验一的基础上，设计实时处理结果的键值模型，并定义一个Bolt完成实时处理结果的存储。<br>（1）任务一：保存词和词频数据<br>键值模型如下：<br>Word: frequency<br>定义VO类和接口：</p><pre><code class="lang-java">public class WordFreq{
private String word;
private int freq;
private Date date; //以月为单位，比如2017-05-01
//setter  getter

}
public interface WordFreqDao{
public void saveWordFreq(WordFreq wf);
}</code></pre><p>（2）任务二：保存词的联合频率<br>键值模型如下：<br>Word-word: frequency<br>定义VO类和接口：</p><pre><code class="lang-java">public class BiWordFreq{
private String word1;
private String word2;
private Date date; //以月为单位，比如2017-05-01
private int freq;

//setter  getter

}
public interface BiWordFreqDao{
public void saveBiWordFreq(biWordFreq wf);
}</code></pre><h2>三、实验设备及软件环境：</h2><p>Windows10专业版<br>IntelliJ IDEA 2020.3.2 (Ultimate Edition)<br>Java15</p><h2>四、实验过程及结果截图：</h2><p>BiWordFreq.java</p><pre><code class="lang-java">package bean;

import java.util.Date;

public class BiWordFreq {
    private String word1;
    private String word2;
    private Date date;
    private int freq;

public void setWord1(String word1) {
        this.word1 = word1;
    }

public String getWord1() {
        return word1;
    }

public void setWord2(String word2) {
        this.word2 = word2;
    }

public String getWord2() {
        return word2;
    }

public void setDate(Date date) {
        this.date = date;
    }

public Date getDate() {
        return date;
    }

public void setFreq(int freq) {
        this.freq = freq;
    }

public int getFreq() {
        return freq;
    }

}</code></pre><p>WordFreq.java</p><pre><code class="lang-java">package bean;

import java.util.Date;

public class WordFreq {
    private String word;
    private int freq;
    private Date date;

public void setWord(String word) {
        this.word = word;
    }

public String getWord() {
        return word;
    }

public void setFreq(int freq) {
        this.freq = freq;
    }

public int getFreq() {
        return freq;
    }

public void setDate(Date date) {
        this.date = date;
    }

public Date getDate() {
        return date;
    }

}</code></pre><p>FrequencyBolt.java</p><pre><code class="lang-java">package bolt;

import java.util.Date;
import java.util.HashMap;
import java.util.Set;
import java.util.Map;

import org.apache.storm.task.OutputCollector;
import org.apache.storm.task.TopologyContext;
import org.apache.storm.topology.OutputFieldsDeclarer;
import org.apache.storm.topology.base.BaseRichBolt;
import org.apache.storm.tuple.Tuple;

import bean.WordFreq;
import dao.WordFreqDAO;

public class FrequencyBolt extends BaseRichBolt {
    private Map&lt;String, Integer&gt; wordFreq;

@Override
    public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {
        // TODO Auto-generated method stub
        wordFreq = new HashMap&lt;String, Integer&gt;();
    }

@Override
    public void execute(Tuple input) {
        // TODO Auto-generated method stub
        String word = input.getStringByField(&quot;word&quot;);
        if(&quot;&quot;.equals(word)) {
            System.out.println(&quot;词频：&quot;);
            System.out.println(wordFreq);
            System.out.println();

Set&lt;String&gt; set = wordFreq.keySet();
            for(String s: set) {
                WordFreq wf = new WordFreq();

wf.setWord(s);
                wf.setFreq(wordFreq.get(s));
                wf.setDate(new Date());

new WordFreqDAO().saveWordFreq(wf);
            }
            return;
        }

if(!wordFreq.containsKey(word)) {
            wordFreq.put(word, 1);
        }
        else {
            wordFreq.replace(word, wordFreq.get(word) + 1);
        }
    }

@Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        // TODO Auto-generated method stub

}

}</code></pre><p>ParticipleBolt.java</p><pre><code class="lang-java">package bolt;

import java.io.IOException;
import java.io.StringReader;
import java.util.Map;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.apache.storm.task.OutputCollector;
import org.apache.storm.task.TopologyContext;
import org.apache.storm.topology.OutputFieldsDeclarer;
import org.apache.storm.topology.base.BaseRichBolt;
import org.apache.storm.tuple.Tuple;
import org.apache.storm.tuple.Values;
import org.wltea.analyzer.lucene.IKAnalyzer;
import org.apache.storm.tuple.Fields;

public  class ParticipleBolt extends BaseRichBolt {
    OutputCollector collector;

public void execute(Tuple arg0) {
        String content = arg0.getStringByField(&quot;content&quot;);

if(&quot;&quot;.equals(content)) {
            collector.emit(new Values(&quot;&quot;));
            return;
        }

try(Analyzer analyzer = new IKAnalyzer(true);) {
            TokenStream stream = analyzer.tokenStream(&quot;content&quot;, new StringReader(content));
            CharTermAttribute cta = stream.addAttribute(CharTermAttribute.class);
            stream.reset();
            while (stream.incrementToken()) {
                collector.emit(new Values(cta.toString()));
            }
        }
        catch(IOException e) {
            e.printStackTrace();
        }
    }

public void prepare(Map arg0, TopologyContext arg1, OutputCollector arg2) {
        collector = arg2;
    }

public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new Fields(&quot;word&quot;));
    }

}</code></pre><p>RelationBolt.java</p><pre><code class="lang-java">package bolt;

import java.io.IOException;
import java.io.StringReader;
import java.util.ArrayList;
import java.util.Date;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Set;

import bean.BiWordFreq;
import dao.BiWordFreqDAO;

public class RelationBolt extends BaseRichBolt {
    private Map&lt;String, Integer&gt; wordFreq;

@Override
    public void execute(Tuple input) {
        // TODO Auto-generated method stub
        String content = input.getStringByField(&quot;content&quot;);
        List&lt;String&gt; wordList = new ArrayList&lt;String&gt;();

if(&quot;&quot;.equals(content)) {
            System.out.println(&quot;关联词频：&quot;);
            System.out.println(wordFreq);
            System.out.println();

Set&lt;String&gt; set = wordFreq.keySet();
            for(String s: set) {
                BiWordFreq wf = new BiWordFreq();
                String[] words = s.split(&quot;-&quot;);

wf.setWord1(words[0]);
                wf.setWord2(words[1]);
                wf.setFreq(wordFreq.get(s));
                wf.setDate(new Date());

new BiWordFreqDAO().saveBiWordFreq(wf);
            }
            return;
        }

try(Analyzer analyzer = new IKAnalyzer(true);) {
            TokenStream stream = analyzer.tokenStream(&quot;content&quot;, new StringReader(content));
            CharTermAttribute cta = stream.addAttribute(CharTermAttribute.class);
            stream.reset();
            while (stream.incrementToken()) {
                wordList.add(cta.toString());
            }
        }
        catch(IOException e) {
            e.printStackTrace();
        }

for(int i = 0; i &lt; wordList.size(); i++) {
            for(int j = i + 1; j &lt; wordList.size(); j++) {
                String str1 = wordList.get(i);
                String str2 = wordList.get(j);
                String key = null;

if(str1.compareTo(str2) == 0) {
                    continue;
                }
                else if(str1.compareTo(str2) &gt; 0) {
                    key = str2 + &quot;-&quot; + str1;
                }
                else {
                    key = str1 + &quot;-&quot; + str2;
                }

if(!wordFreq.containsKey(key)) {
                    wordFreq.put(key, 1);
                }
                else {
                    wordFreq.replace(key, wordFreq.get(key) + 1);
                }
            }
        }

}

@Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        // TODO Auto-generated method stub

}

}</code></pre><p>BiWordFreqDAO.java</p><pre><code class="lang-java">package dao;

import bean.BiWordFreq;
import util.JedisUtil;

import redis.clients.jedis.Jedis;

public class BiWordFreqDAO {

public void saveBiWordFreq(BiWordFreq wf) {
        try(Jedis jedis = JedisUtil.getConnection()) {
            String key = wf.getWord1() + &quot;-&quot; + wf.getWord2();
            int value = wf.getFreq();

if(jedis.exists(key)) {
                jedis.set(key, String.valueOf(Integer.parseInt(jedis.get(key)) + value));
            }
            else {
                jedis.set(key, String.valueOf(value));
            }
        }
        catch(Exception e) {
            e.printStackTrace();
        }
    }

}</code></pre><p>WordFreqDAO.java</p><pre><code class="lang-java">package dao;

import bean.WordFreq;
import util.JedisUtil;

import redis.clients.jedis.Jedis;

public class WordFreqDAO {

public void saveWordFreq(WordFreq wf) {
        try(Jedis jedis = JedisUtil.getConnection()) {
            String key = wf.getWord();
            int value = wf.getFreq();

}</code></pre><p>Spout.java</p><pre><code class="lang-java">package spout;

import java.util.Map;

import org.apache.storm.spout.SpoutOutputCollector;
import org.apache.storm.task.TopologyContext;
import org.apache.storm.topology.OutputFieldsDeclarer;
import org.apache.storm.topology.base.BaseRichSpout;
import org.apache.storm.tuple.Values;
import org.apache.storm.tuple.Fields;

import redis.clients.jedis.Jedis;

import util.JedisUtil;

public class Spout extends BaseRichSpout  {
    private SpoutOutputCollector collector;

public void nextTuple() {
        String content = JedisUtil.getConnection().get(&quot;!&quot;);
        String[] strs = content.split(&quot;\n&quot;);

for(String s: strs) {
            collector.emit(new Values(s));
        }
        collector.emit(new Values(&quot;&quot;));
        try {
            Thread.sleep(Long.MAX_VALUE);
        }
        catch(InterruptedException e) {
            e.printStackTrace();
        }
    }

public void open(Map arg0, TopologyContext arg1, SpoutOutputCollector arg2) {
        collector = arg2;
    }

public void declareOutputFields(OutputFieldsDeclarer arg0) {
        arg0.declare(new Fields(&quot;content&quot;));
    }

}
</code></pre><p>zlh.java</p><pre><code class="lang-java">package test;

import topology.TopologyFactory;
import util.JedisUtil;
import org.apache.storm.Config;
import org.apache.storm.LocalCluster;
import org.apache.storm.generated.StormTopology;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;

public class zlh {

public static void main(String[] args) throws MalformedURLException, IOException {

Document doc = Jsoup.parse(new URL(&quot;https://blog.csdn.net/weixin_45267419&quot;), 50000);
        Elements titles = doc.select(&quot;h4&quot;);
        StringBuffer sb = new StringBuffer();

for(Element title: titles) {
            sb.append(title.html() + &quot;\n&quot;);
        }
        sb.delete(sb.length() - 1, sb.length());

JedisUtil.getConnection().set(&quot;!&quot;, sb.toString());

StormTopology topology = TopologyFactory.factory();

LocalCluster cluster = new LocalCluster();

Config config = new Config();

cluster.submitTopology(&quot;1814010130&quot;, config, topology);

}
}</code></pre><p>TopologyFactory.java</p><pre><code class="lang-java">package topology;

import org.apache.storm.topology.TopologyBuilder;
import org.apache.storm.generated.StormTopology;

import spout.*;
import bolt.*;

public class TopologyFactory {

public static StormTopology factory() {
        TopologyBuilder builder = new TopologyBuilder();
        builder.setSpout(&quot;s1&quot;, new Spout());
        builder.setBolt(&quot;b1&quot;, new ParticipleBolt()).shuffleGrouping(&quot;s1&quot;);
        builder.setBolt(&quot;b2&quot;, new FrequencyBolt()).shuffleGrouping(&quot;b1&quot;);
        builder.setBolt(&quot;b3&quot;, new RelationBolt()).shuffleGrouping(&quot;s1&quot;);
        return builder.createTopology();
    }

}</code></pre><p>JedisUtil.java</p><pre><code class="lang-java">package util;

import redis.clients.jedis.Jedis;

public class JedisUtil {

public static Jedis getConnection() {
//        return new Jedis(&quot;121.89.197.4&quot;, 6379);
        Jedis jedis= new Jedis(&quot;121.89.197.4&quot;, 6379);
        jedis.auth(&quot;root&quot;);
        return jedis;
    }

}</code></pre><p>运行结果：<br><img src="https://www.zlh0812.cn/home/usr/uploads/2021/06/1902062492.png" alt="" title=""style=""></p><p>reids内容：<br><img src="https://www.zlh0812.cn/home/usr/uploads/2021/06/2015543907.png" alt="" title=""style=""></p><h2>五、总结：</h2><p>通过本次实验：理解大数据场景下数据处理和数据保存的结合，掌握Storm和Redis数据库的联合应用</p><p>实验成绩：                 指导教师：               年  月  日</p>

哈尔滨理工大学

软件与微电子学院

实 验 报 告

一、实验目的：

二、实验内容：

三、实验设备及软件环境：

四、实验过程及结果截图：

五、总结：

发表评论 取消回复

storm实时处理结果的NoSQL保存

实验报告

发表评论取消回复