Buscar en este blog
Mostrando entradas con la etiqueta OpenCV. Mostrar todas las entradas
Mostrando entradas con la etiqueta OpenCV. Mostrar todas las entradas
miércoles, 22 de octubre de 2025
MAV. Python.
Introducción, instalación y documentación
Para el tratamiento de imágenes disponemos en Python de [varias herramientas]. Ya conocemos Pillow, pero no podemos hablar de este tema sin mencionar la que posiblemente es la mejor y más completa en la actualidad: OpenCV, que no está desarrolla en Python ni se limita a este lenguaje, aunque es frecuente trabajar con ella desde Python puesto que son plenamente compatibles.
Son muchas las posibilidades que ofrece el trabajo con imágenes mediante OpenCV, desde procesos de manipulación simples hasta desarrollo de IA como la visión por ordenador, el reconocimiento biométrico, el análisis de contenido de vídeos y un largo etc... que incluye el OCR. Por resumir, todo lo que podemos hacer con Pillow y mucho más; motivo más que sobrado para que nos pongamos límites bastante estrictos para no perdernos por caminos tan atractivos como secundarios para los fines de este blog.
Por concretar intereses, dentro del amplio y complejo mundo de la manipulación de imágenes, OpenCV nos va a ayudar como herramienta complementaria (o alternativa) a Pillow para la manipulación de imágenes y como auxiliar para el trabajo con imágenes que contienen texto.
La instalación de OpenCV, paso necesario, no ofrece mayor dificultad: accedemos a [esta página] y copiamos el enlace pip en nuestro cmd. La [manipulación básica] es simple, al menos para los usos que podemos tener inicialmente en mente, pero también muy complejos, cuanto los objetivos también lo son. De hecho te recomiendo la lectura de algunos documentos sobre el tema para que te hagas una idea de las posibilidades de esta biblioteca. Yo estoy en ello.
MAV. Python
Biblioteca OpenCV
Algunos usos básicos
Después de aprender algunas de las posibilidades de trabajo que nos ofrece Pillow, no pretendo (por ahora) más que echar un vistazo a lo básico que OpenCV nos puede ofrecer, así que dedicaré esta entrada a trastear un poco con el código.
Aprenderemos cómo usar OpenCV desde Python (ya que no es una biblioteca Python pero sí accesible y manejable desde este lenguaje) algunas de las funciones más sencillas sin más pretensión. Para ello remito a [esta web] y a [este manual]. Empecemos.
Lo primero será importar la biblioteca (import cv2) y lo siguiente identificar la imagen con la que queremos trabajar...
... para lo cual emplearemos identificaremos la ubicación de la imagen (img_dir ='img/paisaje.png') y aplicaremos la función imread() (img = cv2.imread(img_dir))
Pero para evitar sorpresas tal vez nos interese comprobar que CV2 está correctamente instalado. Para ello y para saber qué versión tenemos instalada aplicaremos la siguiente instrucción: print ('Version cv2: ' + cv2.__version__)
Si todo funciona correctamente podremos trabajar con nuestra imagen, por ejemplo, mostrándola en pantalla...
cv2.imshow("Imagen color", img)cv2.waitKey(0)cv2.destroyAllWindows()
... o mostrando sus dimensiones (obtenemos una matriz de datos)
print('Dimensiones de la matriz de la imagen ' + str(img.shape))
También podemos modificar la imagen, por ejemplo convirtiéndola a escala de grises...
img_gris = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
... o modificando su tamaño
img_pq = cv2.resize(img, (100, 100))
Las opciones disponibles son muchas y muy interesantes, pero tendremos que volver sobre ellas más adelante, ya que lo que nos interesa de forma más inmediata es el uso de OpenCV como recurso para el desarrollo de funcionalidades OCR. A esta cuestión dedicaremos las próximas entradas y volveremos sobre OpenCV más adelante para incrementar nuestros conocimientos sobre manipulación automatizada de imágenes.
jueves, 16 de octubre de 2025
MAV. Python
Procesamiento básico de imágenes
Necesitamos trabajar con imágenes para muchas cosas y desde diferentes perspectivas, algunas muy básicas, como su manejo como documentos o como la simple traslación "a lo digital" de procedimientos manuales, incluyendo el corta-pega y similares. A todo esto (y a más, pero a esto fundamentalmente) es a lo que vamos a llamar procesamiento básico de imágenes.
Disponemos de varias herramientas en Python que, en lo que nos proponemos ahora, sirven para lo mismo, pero que se diferencian en procesamientos de mayor complejidad y especificidad. En esta subsección nos vamos a limitar a dos: Pilow y OpenCV. Con ambas vamos a construir lo que podríamos llamar una navaja multiusos para el manejo básico de imágenes.
La primera, Pilow, es la más sencilla (de instalar y usar), pero sobradamente útil. Puedes acceder a su documentación oficial [desde este enlace], incluye un interesante manual on-line. Y desde [aquí] un mini-curso en YouTube.
La biblioteca OpenCV no es Python en sentido estricto, pero puede ser usada mediante este lenguaje. Su instalación no es más complicada que la de Pilow, pero sí su uso, claro que en consonancia con su potencia y posibilidades de uso. Para descargarla accedemos a [esta página] y [este enlace] te lleva a un mini-tutorial en You Tube.
En las próximas entradas iremos desarrollando algunas opciones de manejo de imágenes que nos proporcionan ambas bibliotecas. La intención no es tratarlas en profundidad (eso queda para ti en función de tus intereses), pero sí disponer, al final del proceso, de un conjunto de recursos de utilidad para que puedas manejar las imágenes que pudieras necesitar para el desarrollo de tus recursos.
Suscribirse a:
Comentarios (Atom)






