在大数据计算服务中,使用MapReduce开发一个分词程序,即输入为保存在表中的多篇文章(每篇文章一行记录),参考一个字典文件(该文件会经常更新)进行分词。简而言之,在执行该程序的时候,既需要输入待分词的文章(已经保存在表中了),又需要输入字典(为经常变动的本地文件),以下最合理的解决方案为?

发布于 2021-03-04 15:49:21
【单选题】
A 将字典文件保存在本地,在MR中通过访问本地最新的字典文件实现
B 将这个字典与源代码一起进行打包,直接执行即可
C 将字典达成jar包,使用jar命令执行MR程序时,通过resource参数指定该jar包
D 每次都将字典文件作为资源上传到大数据计算服务上,然后MR中通过资源的方式来访问

查看更多

关注者
0
被浏览
73
  • 体验AI问答!更聪明、超智能!
  • 一款基于GPT的超级AI助手,可以对话、创作、写文案!
1 个回答

撰写答案

请登录后再发布答案,点击登录

发布
问题

手机
浏览

扫码手机浏览

分享
好友

在线
客服