php图片上的文字怎么取出来 • Worktile社区

不及物动词

这个人很懒，什么都没有留下～

在PHP中，要从图片中提取文字，可以使用光学字符识别（OCR）技术。OCR技术是一种将图片中的文字转换成可编辑文本的技术。

要在PHP中使用OCR技术来提取图片中的文字，可以借助第三方库或API。以下是使用Google Cloud Vision API作为示例的步骤：

1. 注册并创建一个Google Cloud账号，启用Cloud Vision API。
2. 安装Google Cloud SDK并设置好相关环境变量。
3. 在命令行中安装适用于PHP的Google Cloud Vision库。
4. 创建一个PHP脚本，并导入必要的Google Cloud Vision库。
5. 使用库提供的函数读取图片文件，并调用API进行OCR操作。
“`php
require ‘vendor/autoload.php’;

use Google\Cloud\Vision\V1\ImageAnnotatorClient;

$imagePath = ‘path_to_your_image.jpg’;

$imageAnnotator = new ImageAnnotatorClient();

$image = file_get_contents($imagePath);

$response = $imageAnnotator->textDetection($image);
$texts = $response->getTextAnnotations();

foreach ($texts as $text) {
echo $text->getDescription() . PHP_EOL;
}

$imageAnnotator->close();
“`
注意：路径需要替换为实际图片的路径。

6. 运行脚本，会输出图片中检测到的文字。

上述例子中使用了Google Cloud Vision API，你也可以尝试其他的OCR服务或库，如tesseract-ocr。根据所选工具的不同，具体的实现步骤可能会有所差异，但基本原理是相通的。只需要将图片读取、OCR操作及提取出的文字处理部分进行相应调整即可。

2年前 0条评论

worktile

Worktile官方账号

要从图片中取出文字，你可以使用OCR（Optical Character Recognition，光学字符识别）技术。以下是使用PHP实现OCR的一般步骤：

1. 安装依赖库：使用OCR功能，首先需要安装Tesseract OCR引擎。你可以在官方网站（https://github.com/tesseract-ocr/tesseract）上找到适合你系统的安装指南。

2. 安装并配置依赖库：安装Tesseract OCR引擎后，你可以在PHP中使用exec()函数来执行命令行操作。确保配置PHP的执行路径，以使其能够找到Tesseract命令。

3. 图片预处理：在使用OCR之前，你可能需要对图片进行预处理，例如裁剪、缩放或去噪。对于一些复杂的图片，你可能需要使用图像处理库（如GD或ImageMagick）来优化图片质量。

4. 调用OCR引擎：使用exec()函数调用Tesseract OCR引擎，将图片作为输入进行处理。你可以通过传递命令行参数指定输入和输出文件的路径。例如：

“`
exec(‘tesseract input_image.png output_text’);
“`

此命令将读取input_image.png中的文字，并将结果输出到output_text文件中。

5. 读取输出文件：使用PHP的文件读取函数来读取输出文件中的文字。例如，你可以使用file_get_contents()函数来获取输出文件的内容：

“`php
$text = file_get_contents(‘output_text.txt’);
echo $text;
“`

这样，你就可以将图片中提取出的文字输出到控制台或保存到数据库中。

需要注意的是，OCR技术对于识别复杂的字体或扭曲的文字可能会有一定的困难。此外，图像质量、文字大小和背景对OCR结果也会有影响。因此，在使用OCR之前，建议先测试该技术对你的图片和文字是否适用。

2年前 0条评论

fiy

Worktile&PingCode市场小伙伴

在PHP中，如果要从图片上获取文字，首先需要使用图像处理库或扩展，如GD库。GD库是PHP的一个内置图形库，它提供了一组函数来处理图像，包括图片的创建、编辑、处理等操作。

下面我们将介绍一种使用GD库来从图片中获取文字的方法，具体操作流程如下：

1. 确定图片类型：首先需要确定要处理的图片类型。GD库支持的图片类型有JPEG、PNG、GIF等。根据图片的类型，可以选择不同的函数来打开图片，例如`imagecreatefromjpeg()`、`imagecreatefrompng()`等。

2. 打开图片：使用GD库中的函数打开图片，并创建一个新的图像资源，用来存储要处理的图片。示例代码如下：

“`php
$filename = ‘image.jpg’; // 图片文件名
$image = imagecreatefromjpeg($filename); // 打开图片并创建图像资源
“`

3. 获取图像中的文字：GD库本身并不支持直接从图片中提取文字，但可以通过一些图像处理技术来识别和获取图像中的文字。常见的方法有使用OCR（光学字符识别）技术，将图像转换为文本。OCR技术有多种实现方式，可以使用开源OCR库，如Tesseract-OCR，也可以使用第三方的OCR服务，如百度OCR、腾讯OCR等。

以下是一个使用百度OCR服务提取图片文字的示例代码：

“`php
$appId = ‘your_app_id’; // 百度云应用ID
$appKey = ‘your_app_key’; // 百度云应用Key
$appSecret = ‘your_app_secret’; // 百度云应用Secret

$url = ‘https://aip.baidubce.com/oauth/2.0/token’;
$postData = [
‘grant_type’ => ‘client_credentials’,
‘client_id’ => $appKey,
‘client_secret’ => $appSecret,
];

$response = file_get_contents($url, false, stream_context_create([
‘http’ => [
‘method’ => ‘POST’,
‘header’ => ‘Content-Type: application/x-www-form-urlencoded’,
‘content’ => http_build_query($postData),
]
]));

$result = json_decode($response, true);
$accessToken = $result[‘access_token’];

$url = ‘https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic’;

$imageData = base64_encode(file_get_contents($filename));
$postData = [
‘image’ => $imageData,
];

$response = file_get_contents($url . ‘?access_token=’ . $accessToken, false, stream_context_create([
‘http’ => [
‘method’ => ‘POST’,
‘header’ => ‘Content-Type: application/x-www-form-urlencoded’,
‘content’ => http_build_query($postData),
]
]));

$result = json_decode($response, true);

if (isset($result[‘words_result’])) {
foreach ($result[‘words_result’] as $word) {
echo $word[‘words’] . “\n”;
}
}
“`

4. 关闭图像资源：在完成对图片的操作后，记得释放内存，关闭图像资源。

“`php
imagedestroy($image); // 关闭图像资源
“`

需要注意的是，使用OCR技术提取图片中的文字并不是完全准确的，识别结果可能存在错误。因此，如果要获取准确无误的文字信息，建议使用高质量且清晰的图片，并结合其他图像处理技术来提高识别的准确性。

2年前 0条评论