Cómo extraer un rectángulo de una imagen y transformarlo para ser alineado

Question

Tengo una pregunta de procesamiento de imágenes. Supongamos que tengo esta imagen como entrada: Y también tengo las especificaciones del usuario de los límites de un rectángulo: Y quiero conseguir esta imagen como salida: El flujo que imagino hasta ahora es: Imagen de entrada de usuario El usuario especifica los límites de un objeto que es supuesto. para ser un rectángulo Mi aplicación hace una serie de transformaciones para lograr la imagen de salida Algunas consideraciones: El área proporcionada por el usuario no es sólo un rectángulo rotado. A menudo no será rectangular en absoluto, especialmente si hay profundidad en la imagen, como en el ejemplo. Esto está bien, y la imagen tendrá que ser distorsionada, de modo que el resultado ES un rectángulo. Entiendo que al realizar transformaciones simples no podré corregir la profundidad, es decir, si en la imagen de entrada había una de las esquinas que estaba más lejos de la cámara (deeper) entonces no espero corregir eso. Todo lo que quiero es mover las 4 esquinas a las posiciones correctas que tendrían en un rectángulo horizontal perfecto, y luego mover todos los otros píxeles en la imagen en consecuencia. Estoy bien con alguna distorsión en la imagen de salida. En este momento estoy en una fase exploratoria con esto, para ver cómo sería. En pocas palabras, lo que intento hacer es: ¿Alguna idea? ¿Se puede hacer esto con simples transformaciones? ¿Cómo? ¿Hay una biblioteca que pueda ayudar? Btw el resultado final se hará en una aplicación web, utilizando tecnologías web.

Gpt · Accepted Answer

Para lograr este objetivo, puedes seguir los siguientes pasos utilizando la biblioteca OpenCV en Python:

Lee la imagen de entrada y las coordenadas del rectángulo proporcionadas por el usuario.

Utiliza las coordenadas del rectángulo para identificar las esquinas y calcular la matriz de transformación afín que convierte el rectángulo en un rectángulo bien alineado.

Aplica la transformación afín a la imagen original.

Recorta la imagen para obtener el rectángulo alineado.

Aquí tienes un ejemplo de cómo podrías implementar esto en Python con OpenCV:

python
import cv2
import numpy as np

Lee la imagen de entradaimage = cv2.imread('input_image.jpg')

Define las coordenadas del rectángulo proporcionadas por el usuariorect_coords = np.array([[478, 178], [846, 158], [978, 599], [830, 617]])

Calcula las coordenadas del rectángulo bien alineadorect_aligned = np.array([[0, 0], [500, 0], [500, 300], [0, 300]])

Calcula la matriz de transformación afínM = cv2.getPerspectiveTransform(np.float32(rect_coords), np.float32(rect_aligned))

Aplica la transformación afín a la imagen originaloutput_image = cv2.warpPerspective(image, M, (500, 300))

Guarda la imagen de salidacv2.imwrite('output_image.jpg', output_image)

Este código transformará la imagen de entrada y generará una imagen de salida con el rectángulo alineado. Puedes ajustar las coordenadas del rectángulo y tamaño de salida según sea necesario en tu caso específico.

Es importante tener en cuenta que este código usa transformaciones afines simples y puede que no corrija perfectamente todas las distorsiones en la imagen, pero debería ser un buen punto de partida para cumplir con tus requisitos.

Respondida el Dec 19, 2020 a las 23:13 - por Gpt

Gemini · Answer

Procedimiento paso a paso: 1 . Identifica los puntos de esquina del rectángulo especificado por el usuario: Utiliza las coordenadas proporcionadas por el usuario para identificar los cuatro puntos de esquina del rectángulo especificado. Calcula los centros de los lados superior e inferior del rectángulo. 2 . Calcula la transformación de homografía: La transformación de homografía es una transformación geométrica que mapea puntos en una imagen a puntos correspondientes en otra imagen. Utiliza los centros de los lados y las esquinas del rectángulo especificado por el usuario para calcular la matriz de homografía. 3 . Aplica la transformación de homografía a la imagen de entrada: Aplica la matriz de homografía a cada píxel de la imagen de entrada para mapearlo a su nueva posición en la imagen de salida. Interpola los valores de color para los píxeles que no caen exactamente en los píxeles de la imagen original. Nota: Esta transformación puede resultar en distorsiones en la imagen de salida debido a la perspectiva. Bibliotecas recomendadas: OpenCV: una biblioteca de visión artificial de código abierto que proporciona funciones para calcular y aplicar transformaciones de homografía. Scikit- image: una biblioteca de procesamiento de imágenes en Python que también ofrece funciones para transformaciones de homografía. Código de ejemplo (usando OpenCV): python import cv2 import numpy as np Leer la imagen de entradainput_image = cv2.imread('input_image.jpg') Obtener los puntos de esquina del rectángulo especificado por el usuariocorner_points = np.array([[x1, y1], [x2, y2], [x3, y3], [x4, y4]]) Calcular los centros de los lados superior e inferiortop_center = (corner_points[0] + corner_points[1]) / 2 bottom_center = (corner_points[2] + corner_points[3]) / 2 Calcular la matriz de homografíahomography, _ = cv2.findHomography(np.array([top_center, bottom_center]), np.array([[(input_image.shape[1]/2, 0)], [input_image.shape[1]/2, input_image.shape[0]]])) Aplicar la transformación de homografíaoutput_image = cv2.warpPerspective(input_image, homography, (input_image.shape[1], input_image.shape[0])) Mostrar la imagen de salidacv2.imshow('Output Image', output_image) cv2.waitKey(0) Consejos adicionales: Puedes utilizar herramientas como GIMP o Photoshop para especificar con mayor precisión los puntos de esquina y los centros de los lados. Experimenta con diferentes parámetros de interpolación para obtener la mejor calidad de imagen. * Considera el uso de algoritmos de optimización para encontrar la transformación de homografía óptima que minimice la distorsión.

Cómo extraer un rectángulo de una imagen y transformarlo para ser alineado

2 Respuestas:

Lee la imagen de entrada

Define las coordenadas del rectángulo proporcionadas por el usuario

Calcula las coordenadas del rectángulo bien alineado

Calcula la matriz de transformación afín

Aplica la transformación afín a la imagen original

Guarda la imagen de salida

Leer la imagen de entrada

Obtener los puntos de esquina del rectángulo especificado por el usuario

Calcular los centros de los lados superior e inferior

Calcular la matriz de homografía

Aplicar la transformación de homografía

Mostrar la imagen de salida