Tika检测文件类型

2022-10-15,,

tika类型检测

tika支持mime所提供的所有互联网媒体文件类型。每当一个文件通过tika检测到该文件,其文件类型。检测的介质类型,tika内部通过以下机制。

mime标准

多用途internet邮件扩展(mime)标准,用于识别文件类型的最佳标准。这些标准的知识有助于在内部相互作用的浏览器。

当浏览器遇到一个媒体文件,它选择可用它来显示其内容的兼容软件。在情况下,它不具有任何合适的应用程序,以运行一个特定媒体文件,它建议用户获得合适的插件软件。

使用facade类类型检测

facade类的detect() 方法被用于检测文档类型。这个方法接受一个文件作为输入。

下面显示的是文件类型检测与tika外观类的示例程序。

  • 传入参数为file对象时
  @test
    public void getimagetojpeg() {
        try {
            file file = new file("c:\\users\\hww\\downloads\\0855fde2df59fa4fe9427e78d773dde5.jpeg");
            tika tika = new tika();
            string filetype = tika.detect(file);
            system.out.println(filetype);//image/jpeg
        } catch (ioexception e) {
            e.printstacktrace();
        }
    }

输出结果

image/jpeg
  • 传入参数为文件路径时
   @test
    public void getimagetojpg() {
        try {
            tika tika = new tika();
            string filetype = tika.detect("c:\\users\\hww\\downloads\\95a59c718b2575fdbccf66924c14fcd5.jpg");
            system.out.println(filetype);//image/jpeg
        } catch (exception e) {
            e.printstacktrace();
        }
    }

输入结果:

image/jpeg
  • detect()方法参数有以下几种:

 

 

《Tika检测文件类型.doc》

下载本文的Word格式文档,以方便收藏与打印。