RESUMEN: El objetivo del presente estudio es realizar un análisis exploratorio de datos espaciales para describir la estructura económica del Campo de Cartagena desde la perspectiva espacial, utilizando la información disponible en la base de datos SABI (Sistemas de Análisis de Balances Ibéricos) que permite conocer la localización exacta de las empresas ubicadas en esta región. Se han utilizado los programas ArcGIS y GeoDa para realizar este análisis. En la primera parte del trabajo se hace una breve una descripción del más popular de los estadísticos de autocorrelación espacial, el índice de Moran, junto con su versión gráfica, el diagrama de dispersión de Moran. En la segunda parte, se aplican estos indicadores a la información sobre demografía empresarial disponible en la base de datos SABI. Se concluye en este análisis que tanto para los sectores agrícola, industrial y construcción hay una fuerte estructura de dependencia espacial, mientras que para el sector servicios tanto comerciales como no comerciales la localización de empresas no presenta estructura espacial.
Palabras claves: Autocorrelación espacial, índice de Moran, demografía empresarial, aglomeración empresarial
ABSTRACT: The aim of this paper is present an exploratory analysis of spatial data to describe the economic structure of the small area in Murcia Region named Campo de Cartagena. We used the ArcGIS and GeoDa software to perform this analysis using information available in the databank SABI (Analysis Systems Iberian Balance) which give the exact location of companies located in this area. In the first part of the paper a brief description of the most popular statistical spatial autocorrelation, Moran index, is showed. Moreover, we present the graphical version: the Moran scatterplot. In the second part, we apply both indicators to Business Demography to the set of data available in SABI. We conclude from this analysis that both the agricultural, industrial and construction sectors there is a strong spatial dependence structure, while the service sector, commercial or noncommercial, no spatial structure is founded.
Keywords: spatial autocorrelation, Moran index, firm demography, firm agglomeration.
(ProQuest: ... denotes formulae omitted.)
1. Introducción
Existe un amplio consenso en el hecho de que las empresas resultan más competitivas cuando se encuentran agrupadas espacialmente, de esa forma explotan las ventajas productivas asociadas a la proximidad espacial con otras y con aquellos agentes económicos con los que interactúan en su actividad productiva (ver por ejemplo Puga 2010). Por esta razón, el análisis de la distribución espacial de la actividad económica presenta un interés creciente para los investigadores. Tradicionalmente este tópico ha sido explorado utilizando grandes unidades administrativas (p.e. países, regiones europeas, provincias) pero poco se ha explorado cuando el nivel de desagregación espacial es pequeño (p.e. distritos, secciones censales). Este enfoque a nivel micro es una nueva perspectiva del análisis econométrico de datos espaciales que Arbia (2011) ha tildado como 'spatial microeconometric' y que está tomando fuerza debido a la facilidad para disponer de grandes bases de datos con referencia espacial.
Por otra parte, el concepto de independencia es una de las ideas centrales en el desarrollo teórico de la Estadística, pues en la mayoría de los fenómenos físicos, económicos o sociales es raro encontrar dos sucesos que no estén de alguna manera relacionados. Es por ello necesario dar mayor importancia al fenómeno de la dependencia estadística, así como al desarrollo de nuevos instrumentos teóricos que se compadezcan más con la realidad. Los trabajos en Econometría de Series Temporales (por ejemplo, Box y Jenkins 1970) han demostrado que la mayoría de fenómenos económicos no se modelizan por un esquema de mido blanco, y que, por contra, la inmensa mayoría de estos fenómenos siguen esquemas autorregresivos y/o de dependencia temporal. Cuando se estudian datos de corte transversal, es decir, ubicados en un mismo momento, pero repartidos por el espacio, se pierde la secuencialidad propia de las series temporales (cada dato es continuador de otro y le sigue su siguiente, lo que genera una estructura ordinal clara). Esta diferente naturaleza de los datos de naturaleza espacial, obliga al desarrollo de nuevas herramientas de análisis de autocorrelación espacial, partiendo de un principio básico, enunciado por Tobler, W (1970), que se ha convertido en la Primera Ley de la Geografía, "cualquier cosa está relacionada con cualquier cosa, pero las cosas cercanas están más relacionadas que las distantes"
En concreto son fundamentalmente tres las diferencias entre los datos de naturaleza temporal y espacial:
Cuando se analiza información con referencia temporal, se plantea unidireccionalmente, en una dimensión, mientras que en el espacio la dependencia es multidireccional descompuestas en tantas dimensiones como tenga el espacio que estemos estudiando. Esta diferencia es sustancial y separa de forma importante el estudio teórico de ambos tipos de procesos.
En las series temporales existe un sólo punto frontera, mientras que en caso de los procesos espaciales el número de puntos frontera es mucho mayor. (Por ejemplo en una retícula regular nxm hay 2n+2m-4 fronteras).
Finalmente, otra de las diferencias que debe destacarse, es que los modelos autorregresivos en series temporales pueden especificarse mediante las covarianzas, la función de distribución conjunta o las condicionales siendo estos tres tipos de especificación equivalentes. En el caso de los modelos espaciales esto no es cierto.
La autocorrelación espacial en los modelos donde subyace una estructura de dependencia espacial, implica que si se encuentra una determinada observación en un punto localizado geográficamente es más fácil (o más difícil) encontrar observaciones semejantes en puntos próximos a éste que en puntos alejados. Se entiende por tanto que hay latente en la localización de las observaciones una compleja información sobre las observaciones del entorno.
Los trabajos de Moran (1948) y Geary (1954) fueron pioneros en la detección de dependencia entre observaciones referenciadas espacialmente. En ambos trabajos se desarrollan índices que detectan la presencia de autocorrelación espacial que permiten identificar, tanto el nivel de intensidad de la relación como el sentido de la autocorrelación espacial entre las observaciones.
Pero nuestro trabajo tiene una vocación fundamentalmente económica y más en concreto empresarial. La herramienta de la que nos serviremos es el análisis exploratorio de datos como una fase previa a la econometría espacial. Este término, econometría espacial, fue acuñado por Jean Paelinck (1985) al comienzo de la década de los setenta, aunque la definición elegida en este trabajo es debida a Anselin (1992):" es el conjunto de métodos para tratar adecuadamente las características especiales de los datos georeferenciados y de los modelos de economía espacial". El manual de Anselin (1988) es con diferencia la referencia en este tópico.
En los últimos veinte años han sido muchos los autores que han abordado la importancia de la localización en variables económicas clave como la productividad, la eficiencia o el crecimiento. Entre otros destacamos los trabajos de Krugman (1993, 1997) donde se resalta el papel de las extemalidades espaciales en los modelos de comercio internacional y crecimiento. Se han multiplicado los modelos que estudian la influencia del espacio sobre la localización de empresas, desarrollo de complejos industriales, difusión del conocimiento y la tecnología.
El objetivo de este trabajo es analizar la presencia o no de dependencia espacial, tanto a nivel global como sectorial en la distribución de empresas dentro del ámbito geográfico de la Comarca de Cartagena (CC) a la vez que mostrar el uso de dos de los programas más populares para el análisis de este tipo de procesos. Para alcanzar estos objetivos nos hemos servido de la Base de Datos SABI que posee información bastante exhaustiva de alrededor de 8300 empresas ubicadas en la zona. Los 22 distritos censales en los que se divide la CC son las unidades geográficas sobre las que se ha apoyado el estudio.
La herramienta estadística que se ha utilizado ha sido el índice I de Moran, del que se hace una somera descripción en el capítulo siguiente. Para el análisis de este estadístico, así como para la elaboración de los mapas incluidos en este trabajo hemos recurrido a dos software: GeoDa y ArcGIS. Ambos son dos sistemas de información geográfica. El primero de ellos, GeoDa, tiene un enfoque principalmente hacia el Análisis Exploratorio de Datos Espaciales (AEDE) mientras que el segundo tiene una orientación más general aunque las últimas versiones incorporan técnicas básicas de AEDE
2. Metodología
Con el fin de identificar la presencia o ausencia de autocorrelación espacial en un conjunto de datos se han desarrollado un buen número de estadísticos. Estos contrastes plantean como hipótesis nula la independencia de las observaciones frente a una hipótesis alternativa de correlación espacial según una determinada estructura de vecindades especificada a priori por el investigador. El contraste puede plantearse como:
H0 : Independencia espacial.
H i : Hay autocorrelación espacial según la estructura de vecindades determinada.
Rechazar la hipótesis nula implica asumir la presencia de un modelo de dependencia espacial definido bajo la estructura de vecindades definida.
En lo que sigue presentaremos sólo el más popular de los estadísticos de autocorrelación espacial dejando al margen otros contrastes alternativos (p.e. Geary 1954, Getis 1992, Pinkse 2002, López et al. 2010).
2.1 El estadístico I de Moran
Como se plantea en Chasco (2003) las interacciones espaciales suelen estar detrás de la existencia de correlación espacial. El valor que una variable toma en un determinado lugar, \ es función de los valores que esta toma en el resto de lugares donde se ha hecho el estudio, esto es:
...
Pero esta expresión además de no ser operativa, no contempla necesariamente la estructura intema del espacio estudiado. Dicho espacio esta dotado de una estructura de vecindades mucho más compleja que la existente en las series temporales, donde cada dato es limítrofe sólo con otros dos, el anterior y el siguiente.
El concepto de vecindad no es único, pues apelando únicamente a la estructura espacial podríamos hablar de que dos regiones son vecinas si, por ejemplo: comparten frontera común, comparten un punto o se hayan separados por menos de una determinada distancia. Incluso podríamos apelar a vecindad entre dos regiones sin usar conceptos geográficos, por ejemplo, si planteamos que dos regiones son vecinas si tienen una renta similar.
El elemento que nos permite reflejar esta estructura de vecindades es la matriz de interacciones espaciales. El ejemplo más simple de matriz es aquella que coloca el valor 1 en la posición i,j si las regiones i y j son vecinas (habiendo previamente definido este concepto) o 0 en caso contrario o cuando i=j, esto es, en la diagonal de la matriz. Este concepto tan simple de contigüidad fue extendido por Cliff y Ord (1973, 1981). Se pretendía incluir una medida general de interacción entre dos unidades espaciales. Esta extensión vendrá expresada mediante la matriz de contactos W,
...
W = (wij) es una matriz cuadrada no estocástica que cuantifica el efecto de la zona j sobre la i. Los valores de la matriz difieren en función del criterio que se fije para definir la proximidad entre las áreas. En el caso de zonas irregulares pueden ponderarse las fronteras para diferenciar entre distintos grados de proximidad, distinta longitud de la frontera común, etc. Es también una práctica común en aquellas situaciones para las que sea posible, dividir cada elemento de la matriz W por la suma de la fila correspondiente. De esta forma todas las ponderaciones que afectan a la zona i suman la unidad. Este procedimiento tiene como ventaja el que se pondera a todas las regiones por igual, aunque la matriz resultante no será simétrica, generando ciertos problemas de cálculo.
La fonna en que se definan los \vii es un elemento exógeno al problema, estando en manos del investigador dicha definición. Por ejemplo. Cliff y Ord (1.981) proponen una combinación entre la distancia euclidea que une dos zonas (o los centroides de estas zonas) y la longitud relativa de la frontera común entre las zonas. Esta idea implica generalmente una matriz W no simétrica. Otro ejemplo de gran importancia, y que será utilizado en la siguiente sección del trabajo, es el de la inversa de la distancia entre regiones: w^d, j1. Como en el caso de la matriz binaria, la diagonal estaría fonnada por ceros. En Chasco (2003, página 59) se cita una relación bastante exhaustiva de definiciones de pesos, así como el autor que los desarrolló.
Pero si el primer paso era conocer cual es la estructura preexistente (las vecindades) en el espacio estudiado, el objetivo principal de un estudio de dependencia espacial es ver si la distribución de una variable sobre el territorio presenta algún grado de dependencia con la estructura de vecindades, es decir, si regiones o puntos vecinos presentan valores similares (disimilares).
En los últimos años se han desarrollado diferentes herramientas estadísticas que pretenden analizar el grado de dependencia espacial, tanto de fonna global, que se manifiestan en la presencia de tendencias en la distribución de una variable sobre el espacio; como de fonna local, entendida como el estudio de la presencia de patrones en detenninadas áreas geográficas. En Chasco (2003, página 63) encontramos una enumeración de algunos de estos estadísticos.
El primero de los índices globales que se desanolló, y quizás el más intuitivo de todos, es el I de Moran (1950). Su fundamento yace en el estudio de la conelación entre el valor de la variable en una región, y!, y el promedio del valor de ésta en las regiones vecinas, Wyj.
... (1)
... (2)
Donde n el número de elementos de la muestra.
Observemos que cuando la matriz W está estandarizada, el cociente - = \ Sn
Debemos destacar que este coeficiente tiene la forma clásica de una medida de autocorrelación. El numerador es una medida de la covarianza y el denominador la varianza. Bajo la hipótesis nula, el momento de primer orden del estadístico de Moran, es:
... (3)
Su distribución, bajo condiciones relativamente débiles (Sen, 1976), es asintóticamente normal. Esta distribución asintótica del estadístico puede ser utilizada para contrastar la hipótesis nula utilizando el clásico procedimiento inferencial. Por otra parte, son muchas las situaciones en las que la normalidad de la variable es de difícil justificación. En estos casos, ha ganado popularidad debido a su elevada potencia en un amplio rango de situaciones el método de inferencia basado en bootstrapping permutacional. Este método, básicamente consisten en describir la distribución del estadístico / mediante la obtención de diferentes valores del índice permutando las realizaciones de la variable por las diferentes regiones. La implementación de este método es posible gracias a software como GeoDa y ArcGIS, que además permiten elegir el número de permutaciones (boots en terminología inglesa) deseadas. El valor de 999 boots es el más común.
La hipótesis alternativa, a la que antes hacíamos alusión, se refiere a la existencia de autocorrelación o dependencia espacial en la variable analizada bajo la estructura de vecindades definida por W. Hablaremos de autocorrelación espacial positiva cuando se constituyen clusters de valores similares en nuestra variable. Por el contrario, se habla de autocorrelación espacial negativa cuando se detectan clusters de valores disímiles.
Este estadístico alcanza valores positivos y negativos dependiendo del signo de la correlación espacial, acercándose a 1 cuando esta es positiva y a -1 cuando la autocorrelación es negativa.
En el caso de la distribución de empresas, Guillain y Le Gallo (2010) y Arbia (2001) sugieren utilizar tres esquemas diferentes para tratar de identificar la distribución espacial de las actividades económicas de referencia: (i) alta concentración y baja dependencia espacial; (ii) alta concentración y alta dependencia espacial; y (iii) baja concentración y alta dependencia espacial.
2.1.1 Diagrama de dispersión de Moran.
El diagrama de dispersión de Moran es un gráfico mediante el cual se representa en el eje de abscisas las observaciones de la variable X normalizada y el eje de ordenadas el retardo espacial de esta variable también normalizado, suponiendo que la matriz W está estandarizada. De esta forma aparecerá una nube de puntos (xi.wxi) de tal forma que si se encuentra dispersa sobre el plano será un indicador de ausencia de autocorrelación espacial, mientras que si la nube de puntos es próxima a la recta y=x (o a la recta y=-x) indicará la presencia de una fuerte dependencia espacial positiva (resp. negativa), esto se corresponde con la regresión lineal entre las variable original X y su retardo espacial, WX. En este gráfico los cuatro cuadrantes se corresponden con un tipo distinto de asociación espacial. Así aquellos valores situados en el primer (o tercer) cuadrante se corresponden con observaciones que están por encima (respectivamente por debajo) de la media para las que en su entorno se encuentran valores por encima de la media (respectivamente por debajo de la media), y esto será más cierto en tanto en cuanto esté más próximo de la diagonal (y=x). Los valores situados en el segundo y cuarto cuadrante se corresponderán con aquellos en los que el valor observado en un área sea diferente del valor medio del entorno. Los valores situados en el segundo cuadrante se corresponde con observaciones de la variable que siendo inferior a la media en su entorno se encuentran valores superiores a ésta, por el contrario los puntos situados en el cuarto cuadrante indican valores superiores a la media en cuya vecindad se da un valor medio inferior a la media.
Con este tipo de gráficos es posible obtener una información detallada de las observaciones que contribuyen de forma positiva a la autocorrelación espacial y cuales contribuyen negativamente.
Otra utilidad de este tipo de gráficos es la posibilidad que ofrecen para detectar observaciones espacialmente atípicas (conocidas como outliers espaciales) que pueden desfigurar el índice de Moran, bien con contribuciones excesivamente elevadas a este índice, que indiquen autocorrelación espacial cuando realmente no la hay, o bien con contribuciones elevadas y de signo negativo que induzcan a pensar que no existe asociación espacial cuando realmente si la hay.
2.2. Software para el análisis de datos espaciales
Existe una gran oferta de programas que gestionan información georreferenciada. En Chasco (2003, páginas 32 y 33) podemos ver alguno de ellos. En este trabajo se ha utilizado principalmente ArcGIS, y de manera complementaria GeoDa.
ArcGIS, no es un software libre, pero quizás es el software de tratamiento de datos georeferenciados más potente del mercado. Es un programa producido y distribuido por ESRI (Environmental Systems Research Institute) y que agrupa varias aplicaciones para la gestión de la información geográfica: ArcGIS Desktop, Arcglobe, Arcmap, Arccatalog, Arctoolbox, Arcscene.
Para nuestros propósitos, ArcGIS ha sido utilizado en una doble dirección:
Creación y tratamiento de mapas: Este programa trabaja superponiendo capas (raster o de pixeles y vectoriales). ArcGIS nos permite trabajar de forma independiente sobre cada capa además de resolver los posibles problemas de georreferenciación ligados a la disparidad de sistemas de referencia que pueden tener las distintas capas.
Cálculo: Nos ha permitido crear Diagramas de dispersión de Moran, Mapas Lisa (en la sección siguiente se hablará de ellos) y la distribución del índice I de Moran junto con los p-valores y el valor de dicho índice.
Por otro lado GeoDa es un software con menos potencialidad como Sistema de Información Geográfica y carece de muchas de las opciones que permite manejar este tipo de información, pero por el contrario está específicamente desarrollado para realizar un AEDE, permitiendo la obtención, tanto de matrices de conectividades (W) como de los mas populares indicadores globales y locales de autocorrelación espacial. Dispone también de un output gráfico ideal para explorar la vertiente espacial de cualquier conjunto de datos, tanto de observaciones puntuales como reticulares. En el caso de la aplicación que se mostrará en la siguiente sección, utilizaremos el diagrama de dispersión de Moran.
3. Estudio de la distribución espacial de empresas en el campo de Cartagena
El objetivo de esta sección es explorar la distribución espacial de la actividad económica de la Comarca de Cartagena. Para alcanzar este objetivo utilizaremos como variable proxy o indicador de la actividad económica el número total de empresas. Sobre esta variable utilizaremos las herramientas del AEDE descritas en la sección anterior. En concreto, mediante el uso de la información disponible en SABI, que aporta la ubicación geográfica de cada empresa y los programas ArcGIS y GeoDa, se estudiará el grado de dependencia espacial de esta variable, tanto a nivel global como para los distintos sectores de actividad económica. Y lo haremos desde una doble vertiente:
* Cuantitativa, mediante el calculo del índice de Moran, su distribución y el Diagrama de Dispersión de Moran.
* Gráfica, con análisis de los diferentes mapas presentados.
3.1. Descripción del ámbito geográfico: La Geografía de la Comarca de Cartagena
La Comarca de Cartagena (Figura 1) está situada en el Sureste de La Región de Murcia. Es una zona fundamentalmente plana con la excepción de la zona litoral donde se encuentran las mayores elevaciones de la Comarca. Lo anterior, junto con una ligera inclinación NO-SE hace que la mayoría de los cauces (con algunas excepciones) desemboquen en la zona Este, donde se encuentra el Mar Menor, una laguna salada que es sin duda el elemento geográfico más sobresaliente de la zona. Otro elemento a destacar, sobre todo por su importancia económica, es la riqueza minera de esta área centrada sobre todo en municipios como La Unión o Mazarrón.
La Comarca de Cartagena está dividida en 8 municipios, cuya extensión supone algo más del 13% de la superficie regional. En cuanto a su población, como vemos en la Tabla 1, su peso es significativamente mayor en el contexto regional, con una población de 390.983 que alcanza una densidad de 263,83 habitantes por Km2que más que duplica el dato regional.
3.2. La Base de Datos SABI, Sistema de análisis de balances ibéricos
La base de datos SABI suministrada por Informa S.A recopila información económica, fundamentalmente sobre datos contables, de más de 1.230.000 empresas en España. Se dispone de información referente a los principales registros contables de la empresa, así como otras magnitudes relevantes tales como su tamaño empresarial, sector de actividad, localidad y lo que es mas importante para nuestro estudio: La exactas coordenadas de latitud y longitud de cada empresa que permite incorporar esta información en un Sistema de Información Geográfica para su análisis espacial. Esta base de datos no es exhaustiva. Aproximadamente una tercera parte de las empresas españolas están aquí registradas. La cobertura de la base de datos es desigual para los distintos tamaños, comunidades o sectores de actividad si se considera como referencia los datos suministrados del DIRCE (Directorio Central de Empresas). Por tamaño empresarial se contienen valores de mas de un tercio de las microempresas, y para más de las tres cuartas partes de las pequeñas empresas (10 a 49 trabajadores), porcentaje que se va incrementado cuanto mayor es el tamaño empresarial. Por comunidades autónomas, SABI presenta una cobertura para Madrid y Cataluña superior al 40%, mientras que para el resto de comunidades el grado de cobertura es sensiblemente inferior. Sectorialmente, el mayor grado de cobertura se obtiene en las actividades extractivas, energía y agua alcanzando casi el 80% y el menor en el sector servicios en el que escasamente se supera el 30% de las empresas.
En el año 2009, se disponía de información de 35.892 empresas ubicadas en la Región de Murcia. Con la información bruta de SABI, para nuestros objetivos de análisis las empresas se han agmpado por municipios y distritos censales1 de ubicación, atendiendo también al sector económico de actividad. Así, se han agmpado las empresas dependiendo del tipo de actividad económica que realizan en: Agricultura, Pesca, Industria, Construcción, Servicios Comerciales (SC) y No Comerciales (SNC), en estos últimos se incluye la Hostelería. Las variables en las que hemos concentrado nuestra atención son el número de empresas y el empleo. Respecto al número de empresas se han considerado sólo aquellas que se encuentran activas. A continuación, se ha agmpado los datos de dichas variables por municipios de instalación y distrito censal.
Como se apuntó anteriormente, nuestro análisis se centrará sólo en los municipios que componen la Comarca de Cartagena como unidad económica. En total en la base de datos SABI se dispone de información para 8.314 empresas, donde más de la mitad se encuentra clasificada dentro del sector servicios, tanto comerciales como no comerciales. Sólo 40 empresas están clasificadas en el sector de la Pesca que hemos mantenido en este estudio por la importancia histórica de la actividad en la Comarca, aunque no formará parte del análisis espacial de la sección siguiente debido a que su escaso número restaría significatividad a los datos obtenidos.
3.3 La demografía empresarial de la Comarca de Cartagena
En la Tabla 2 se presenta la distribución porcentual de empresas agmpadas por sector de actividad de la información recogida en SABI. Destacamos en este caso el municipio de Los Alcázares por su actividad en servicios no comerciales. Fuente Álamo por su actividad Agrícola e Industrial. Mazarrón por la actividad pesquera y La Unión por su posición destacada en actividades asociadas a la Construcción.
3.4 Dependencia espacial en el número total de empresas
Antes de comenzar este estudio, debemos precisar que el número de distritos censales que componen la comarca es reducido, 22, y que este pequeño tamaño muestral puede condicionar alguno de los resultados que se van a presentar. En todo caso debemos advertir igualmente que este número es superior a 16 y que hacer un estudio basado en unidades espaciales más pequeñas (secciones censales) podría sesgar más aún los resultados debido a que un gran número de estas unidades espaciales no contienen ninguna empresa.
Los mapas que se van a presentar reflejan por una parte, la ubicación de la empresas y por otra, el número de éstas que están instaladas en cada uno de los distritos censales, marcado esto último con el color de cada distrito: cuanto más oscuro, mayor número de empresas. La Figura 2 muestra la distribución del número total de empresas en la Comarca de Cartagena utilizando ArcGIS. Cada uno de los puntos del mapa se corresponde con la exacta localización de las empresas atendiendo a la información obtenida en SABI. La unión espacial de los mapas de los distritos censales por un lado y de los puntos con las empresas por otro, permite contabilizar cuántas empresas y de que sector económico hay en cada unidad espacial. Esta información no está disponible si no se utilizan este tipo de sistemas informáticos.
Para complementar la información de los mapas procedemos al cálculo del estadístico I de Morán. Tal y como ya se apuntó en la sección anterior, utilizando tanto el programa ArcGIS como GeoDa. Con el primero de ellos obtendremos la significatividad del estadístico utilizando la versión asintótica, mientras que con el segundo la versión pennutacional. En los gráficos que se muestran en la Figuras 3 y 4 aparecen estos gráficos para la totalidad de las empresas de la Comarca. Los resultados aquí obtenidos son en principio contradictorios cuando utilizamos ArcGIS puesto que si se usa el principio de contigüidad (la matriz cuyo valor ivy= 1 si las regiones i y j tienen frontera común y 0 en caso contrario) el z-valor del índice de Moran es 1,55 con un p- valor de 0,121, presumiéndose una distribución aleatoria de la empresas. Por el contrario, si el principio utilizado es el de la inversa de las distancias entre regiones, el z-valor es en este caso 2,197 con un p-valor asociado de 0,028, concluyéndose ahora sí, la existencia de correlación espacial en la distribución estudiada. Similares resultados obtenemos al utilizar GeoDa ahora evaluando la significatividad mediante permutaciones. Las Figuras 5 y 6 vienen a confirmar esta tesis.
En la Figura 5 se muestra el diagrama de dispersión de Moran usando GeoDa. En este gráfico se representa, en eje horizontal, la variable número de empresas en los distritos censales normalizada. En el eje vertical aparece la variable, también normalizada, promedio de empresas en la vecindad de cada distrito. En este diagrama se ha aplicado la matriz de pesos basada en el principio de contigüidad de la torre: la posición i, j de la matriz es uno si dos regiones comparten frontera y 0 en caso contrario. Los valores de la diagonal son 0. A la derecha de este gráfico se muestra el pseudo- valor del estadístico I de Moran obtenido esta vez por bootstrap junto con la distribución de los 999 replicas del estadístico I obtenidos para cada una de las permutaciones. Los resultados en significatividad por ambos métodos (asintótico y pennutacional) aunque no iguales si que suministran la misma información. No hay claros síntomas de dependencia espacial.
En la Figura 6 los ejes representan las mismas variables que en la figura anterior, aunque en este caso se ha aplicado la matriz de pesos basada en el principio del inverso de la distancia: la posición i, j de la matriz es el inverso de la distancia entre las regiones i y j y los valores de la diagonal son 0. Como ya se podía ver en la Figura 4, el grado de correlación es mayor también cuando se utiliza la versión boots del estadístico I.
La aparente contradicción anterior se explica si tenemos en cuenta que: (a) Considerar los pesos de los inversos de las distancias permite contemplar la influencia de cualquier región en todas las demás, a diferencia del principio de contigüidad que solo permite analizar la influencia entre regiones vecinas, (b) Estamos estudiando una comarca no muy extensa, además de bien comunicada, especialmente en su parte oriental. Esto viene a justificar que la influencia de "todos sobre todos" sea un hecho, (c) Se ha de tener en cuenta el efecto que tienen los distritos censales de la ciudad de Cartagena, mucho más pequeños que el resto y con mayor número de vecindades que los demás, además de concentrar una gran cantidad de empresas en su seno, (d) Como advertíamos al principio, puede que el número de distritos en los que hemos basado el estudio explique parte de esta discrepancia.
Lo anterior nos lleva a concluir la conveniencia de usar la matriz de pesos formada por los inversos de las distancias, y como derivada de lo anterior, deducir la existencia de correlación espacial en la distribución de las empresas dentro de los distritos censales de la Comarca.
Desde un punto de vista meramente descriptivo, podemos concluir, de observar la Figura 2, varios elementos interesantes sobre la taxonomía empresarial de la zona:
(a) Los cascos urbanos de las ocho ciudades son los grandes cluster de esta área, (b) Zonas como Escombreras o el Polígono de Los Camachos, no logran desbancar ni de lejos a la ciudad de Cartagena como base de la mayoría de empresas de la ciudad, (c) Caso aparte merece el Polígono Industrial Cabezo Beaza, donde vemos que sí se han instalado un número importante de empresas. (d)Por último reseñar el papel de las vías de comunicación como elementos sobre los que se instalan empresas, sobre todo la N-301a, con un trazado Norte-Sur, sobre la que han surgido gran número de empresas desde su salida de Cartagena hasta Santa Ana.
Pasamos ahora a analizar la distribución del número de empresas en los cinco sectores en los que las hemos clasificado. En el primero de ellos, el agrario, mostrado en la Figura 7, debemos apuntar que:
* El Norte de la Comarca (Torre Pacheco, Fuente Álamo, San Javier y el Norte de Cartagena) son los principales focos de atracción de empresas.
* La ubicación de la sede de estas empresas está en su imnensa mayoría en los núcleos poblacionales. Esta aparente paradoja, recordemos que hablamos de un sector que desarrolla su actividad en el campo, se explica porque las sedes suelen instalarse donde se desarrollan las tareas administrativas.
* A diferencia de lo que ocurre para el conjunto de las empresas, las del sector agrario no demuestran estar condicionadas por las grandes vías de comunicación.
* El municipio de Los Alcázares y el distrito censal donde se ubica el núcleo poblacional de Torre Pacheco fonnan un par de duster. Para concluir debemos apuntar que este sector sí presenta un alto grado de correlación espacial pues su p-valor es prácticamente nulo
Si el Norte de la Comarca es el gran foco de atracción de la actividad agraria, tanto a nivel comarcal como regional, el municipio de Cartagena concentra la mayor cantidad de empresas industriales de la Comarca. En 2010, concentraba más de la mitad de las empresas activas de la zona. Casualmente, idéntica proporción se daba en el número de trabajadores dedicados a esta actividad.
Por razones didácticas hemos decidido usar para este sector un mapa LISA expuesto en la Figura 8 (ver Chasco 2003 para información detallada de estos mapas). En este tipo de mapas se representan las relaciones entre el valor de una variable en una región y el de las regiones vecinas. Más en concreto, el color amarillo nos informa de que en esa región se da un valor alto de la variable pero bajo en las regiones vecinas. El negro viene a significar un alto valor de la variable en la región y en sus vecinas.
La impresión que se desprende de esta figura nos permite ubicar como protagonistas a dos distritos del Cartagena: La Palma y Escombreras. El primero (en negro en el mapa) podría ser considerado como un cluster pues posee una alta concentración de empresas industriales y los distritos colindantes también. Por el contrario el Distrito de Escombreras, pese a tener también un alto número de este tipo de empresas, está rodeado de distritos poco desarrollados. Es este un hecho interesante puesto que son los distritos situados al Este del citado valle, los del municipio de La Unión, quienes sufren esta carencia (uno de ellos en azul claro en el mapa). Podríamos estar ante un caso en el que la existencia de dos grande focos de atracción de empresas industriales, el Valle de Escombreras y el Polígono Industrial Cabezo Beaza (situado también en este distrito), impiden el desarrollo de La Unión, explicando en gran medida que sea éste el municipio de La Región con mayor tasa de desempleo (cerca de 3.000 de sus 18.00 habitantes estaban en paro en septiembre de 2012).
También en este sector, como en el agrario, obtenemos un p-valor casi nulo (recordemos que se está aplicando la matriz de los inversos de la distancia) lo que nos lleva a concluir que se da una fuerte dependencia en la distribución espacial de las empresas de este sector.
En el tercero de los sectores, el de la construcción, la Base de Datos SABI tenía registrada a comienzos de 2010, unas 768 empresas. La grave crisis económica que sufrimos se está cebando principalmente con este sector, lo que hace que cualquier dato deba ser puesto en cuarentena. Para visualizar este hecho valgan los siguientes datos: en la Región de Murcia hay, en 2012, un 37% menos de empresas de construcción (que son las catalogadas en los grupos 41,42 y 43 en la clasificación CENAE-2009) que en 2008.
Añádase a lo anterior el enonne peso que las microempresas tienen en este sector, ya que casi 5 de cada 8 son autónomos sin asalariados (casi el doble del porcentaje de este tipo de empresas que en el conjunto del país). Esto añade más incertidumbre a los datos pues en general las empresas pequeñas tienen una vida media inferior a las grandes. Además, la pequeña dimensión de la mayoría de ellas hace que en muchos casos no aparezcan en la Base de Datos SABI
Entrando en el análisis del sector, mostrado en la Figura 9, debemos reseñar que:
* Los municipios costeros, sobre todo Mazarrón, con 145 empresas, San Javier, con 129, y Torre Pacheco con algo más de 250 (en esta localidad más del 20% del tejido empresarial se dedica a la construcción y emplea a cerca de 2.700 personas), poseen la mayor concentración de empresas constructoras.
* Centrándonos en el municipio de Cartagena, debemos indicar que el polígono industrial Cabezo Beaza es otro foco de concentración de empresas de construcción pues da cobijo a 66 (sobre un total de 394 empresas) en las que trabajan cerca de 1.000 personas.
* Finalizamos apuntando que, como en el sector agrario y en el industrial, este sector también presenta un alto grado de dependencia espacia espacial a juzgar por el p-valor obtenido con la matriz de pesos de los inversos de la distancia.
Todo lo anterior viene a justificar un hecho por todos conocidos, y es que la actividad constructora en La Comarca se ha centrado en la costa y en la construcción de Resorts en el interior. Aquí lia jugado un papel fundamental Polaris World, paradigma de empresa dedicada a la construcción de urbanizaciones entorno a campos de golf, alejadas de la costa, ubicadas en antiguos terrenos de uso agrícola recalificados. La mayor parte de sus desarrollos se ha centrado en el municipio de Torre Pacheco, donde además tiene su sede social.
En cuanto a la distribución de empresas de servicios comerciales indicaremos que algo más de la mitad de las empresas del sector, 924, se asientan en el municipio de Cartagena. Además es interesante indicar el papel que desempeña La Carretera Nacional N-301a así como el del polígono industrial Cabezo Beaza, donde se encuentran 127 de estas empresas (de un total de 1.449 en el sector) y trabajan 1.430 personas, justamente el 10% del total de trabajadores de este sector en toda La Comarca.
En la categoría de empresas de servicios no comerciales se incluyen todas aquellas dedicadas a sectores como la educación, la sanidad, las actividades asociativas, recreativas, culturales y deportivas. En este sector se percibe una menor influencia de los polígonos industriales como atractores de estas empresas. Por poner un ejemplo, el polígono más importante de la comarca, el Cabezo Beaza, incluye al 10% del tejido de empresas de servicios comerciales. En las no comerciales, apenas alcanza el 5%.La naturaleza de este tipo de negocio obliga a ubicarlo en el centro de las ciudades, un ejemplo de esto es que en 2010, sólo en la ciudad de Cartagena había 1.923 empresas que daban trabajo a cerca de 10.000 personas.
Un hecho que hace singular a este sector respecto al resto es el peso de "Lo Público", sobre todo en sanidad y educación. Como este trabajo se centra únicamente en la actividad empresarial, deja fuera el papel que las diferentes administraciones tienen en la oferta de servicios a los ciudadanos.
Para finalizar debemos indicar que en estos dos últimos sectores no se aprecia dependencia espacial en la distribución de las empresas, a diferencia de los tres sectores anteriores.
4. Conclusiones y futuras líneas de investigación
El objetivo de este trabajo ha sido doble. Por un lado se ha presentado uno de los indicadores de dependencia espacial más utilizados en el ámbito de la econometría espacial: El índice I de Moran. Por otro, se ha explorado la distribución espacial de la economía de la Comarca de Cartagena utilizando la demografía empresarial como herramienta de análisis. Ambos análisis se han realizado utilizando dos software específicos para el análisis de la información con referencia espacial ArcGIS y GeoDa.
Aunque la Comarca de Cartagena no es una unidad geográfica oficialmente establecida, sí que hay razones históricas y económicas que invitan a considerarla como una región homogénea que engloba a 8 municipios de la Región de Murcia y cuya población supone más del 25% del total regional.
En lo que se refiere a la demografía empresarial, sólo hay cifras oficiales a nivel de Comunidad Autónoma ofrecidas por el INE a través de la base de datos DIRCE. No hay por tanto información demográfica de las empresas a un nivel de desagregación espacial inferior. Esto nos ha obligado a descartar esta base y acudir a la información disponible en la base de datos SABI, menos exhaustiva que la anterior (recordemos que DIRCE tiene naturaleza censal) pero que posee datos sobre la ubicación espacial de cada empresa, elemento éste básico en nuestra investigación.
La información disponible en SABI nos permite elaborar el primer mapa de la distribución geográfica de las empresas en La Comarca, y por extensión el primer análisis del mismo. En este mapa se observa con detalle la localización exacta de todas y cada una de las más de 8.000 empresas, permitiendo identificar patrones espaciales de localización. El uso de Sistemas de Información Geográfica ha sido una herramienta imprescindible para este estudio.
A partir de este mapa y utilizando la potencia del SIG, hemos podido asignar cada empresa al Distrito Censal donde se encuentra ubicada. Esta asignación ha permitido explorar la distribución espacial de las empresas utilizando como unidad espacial de análisis el Distrito Censal. De los resultados de este análisis podemos extraer las siguientes conclusiones:
* Si consideramos todas la empresas, hay estructura de dependencia espacial confirmada por el índice de Moran con un valor estandarizado de 2,19 (p- valor=0,027). Esta estructura no es más que el fruto de la fuerte agrupación de empresas en Cartagena, dividida en 5 Distritos Censales de pequeño tamaño. También están condicionadas por las grandes vías de comunicación.
* Si consideramos las empresas por sectores de actividad, tanto en Agricultura como en Industria se identifican patrones de dependencia espacial, frente a los sectores de servicios donde no se observa esta estructura. El patrón espacial en Agricultura se debe a la fuerte presencia de empresas de este sector en el Norte de la Comarca (Torre Pacheco, Fuente Álamo, San Javier y el Norte de Cartagena). Las empresas agrícolas no están condicionadas por las vías de comunicación más importantes.
* La aglomeración de empresas en el Sector Industrial es fundamentalmente debida a la presencia de dos distritos en Cartagena con elevados porcentajes de actividad en este sector, el de la Palma y el de Escombreras.
* El sector de la Construcción también presenta estructura de dependencia espacial. Los municipios costeros, sobre todo Mazarrón y San Javier, con casi 300 empresas entre ambos, y Torre Pacheco con más de 250 (en Torre Pacheco más del 20% del tejido empresarial se dedica a la constmcción y empleaba a mas de 2700 empresas) poseen una mayor concentración de empresas constructoras.
* Los sectores de servicios no presentan estructura de dependencia espacial. La principal razón es que estas empresas se distribuyen fundamentalmente en los cascos urbanos y en ninguno de ellos se observa un nivel de actividad superior al que cabe esperar en caso de equidad en la distribución.
Notemos finalmente que son varias las limitaciones de este estudio. En primer lugar la falta de representatividad muestral de la información que ha servido de base a este trabajo basada en SABI. Esta limitación es insalvable ya que no se dispone de otra base de datos que suministre información a un nivel de desagregación inferior al provincial. Esperemos que en un futuro se disponga de información de mayor calidad que permita contrastar los resultados de este análisis. En segundo lugar el número de unidades espaciales con las que se ha trabajado es muy pequeño, lo que podría inducir a una falta de consistencia de los resultados. Pese a lo anterior, el método de inferencia utilizado, basado en bootstrapping permutacional en vez de en la distribución asintótica del estadístico, confiere robustez a los resultados obtenidos.
1En España, el distrito censal es la unidad administrativa inmediatamente inferior al municipio. Por debajo de este se encuentra la sección censal. En todo el país había en 2.005 algo más de 8.100 municipios que se dividían en 10.521 distritos (en la inmensa mayoría de los pueblos más pequeños el municipio coincide con el distrito) y 34.800 secciones.
Referencias Bibliográficas
1. D. Puga, The magnitude and causes of agglomeration economies. Journal of Regional Science 50 (2010) (1):203-219.
2. G. Arbia, G. A lustrum of SEA: recent research trends following the creation of the Spatial Econometrics Association (2007-2011). (2011). Spatial Economic Analysis, 6(4), 377-395.
3. G.E.P. Box y G.M. Jenkins Time Series Analysis, Forecasting and Control (Holden-Day, San Francisco 1970).
4. W. Tobler, A computer Movie Simulating Urban Growth in the Detroit Region .Economic Geography, 46 (1970) 234-240.
5. P. Kmgman Geografía y comercio. Editorial Antoni Boschv (1993)
6. P. Kmgman Desarrollo, geografía y teoría económica. Editorial Antoni Boschv (1997)
7. P. Moran, The Interpretation of Statistical Maps. Journal of the Royal Statistical Society B, 10, (1948) 243-251.
8. R. Geary, The contiguity ratio and statistical mapping. The Incorporated Statistician 5, (1954)115-145.
9. J.H.P. Paelinck, Elements d'Analyse Economique Spatiale. (1985) París: Económica
10. L. Anselin, Space and applied econometrics, Anselin (ed.). Special Issue. Regional Science and Urban Economics. 22. (1992)
11. L. Anselin. Spatial econometrics: Methods and models. (1988) Kluwer Academic Press.
12. A. Getis, A. y J.K. Ord. The analysis of spatial association by use of distance statistics. Geographical Analysis (1992) 24, 189-206.
13. J. Pinkse, y Brett, C., Spatial price competition a semiparametric approach. Econometrica (2002) 70, 1111-1153.
14. FA López, M Matilla, J Mur y M Ruiz A Non-Parametric Spatial Independence Test Using Symbolic Entropy, Regional Science and Urban Economic. (2010) 40, 106-115
15. Chasco, C. (2003) Econometría espacial aplicada a la predicción-extrapolación de datos microterritoriales. Consejería de Economía e Innovación Tecnológica de la Comunidad de Madrid. Descargable desde: http://www.madrid.org/cs/Satellite7idConsejeriaM 109266187242&idListConsj=l 109265444710&c=CM_Publicaciones_FA&pagename=ComunidadMadrid%2FEs tructura&sm=l 109266101003&idOrganismo=l 109266227074&pid=l 1092654446 99&language=es&cid= 1114175317832
16. A.D. Cliffy J.K. Spatial Autocorrelation (Pion, London, 1973)
17. A.D. Cliff y J.K Spatial Processes. Models & Applications. (Edit. Pion Limited, 1981).
18. A.K. Sen, Large sample-size distribution of statistics used in testing for spatial correlation. Geographical Analysis 8, (1976) 175-184
19. R. Guillain y J. Le Gallo, Agglomeration and dispersion of economic activities in and around Paris: an exploratory spatial data analysis. Environment and Planning B: Planning and Design. 37, (2010) pp. 961-981
20. G. Arbia, Modelling the geography of economic activities on a continuous space. Papers in Regional Sciences. (2001)80(4), 411-424
Software
1. Microsoft Excel 2000, Microsoft CorporationHttp://microsoft.com/spain/Office
2. ArcGIS 10.0, Enviromnental Systems Research Institute, www. esri. com/software/arcsis
3. Geoda, Anselin, Luc, Ibnu Syabri and Youngihn Kho (2006). GeoDa: An Introduction to Spatial Data Analysis. Geographical Analysis 38 (1), 5- 22. https://geodacenter.asu.edu
FRANCISCO TOMAS CERDAN
ftomas. cerdantipupct. es
Departamento de Métodos Cuantitativos e Informáticos
Universidad Politécnica de Cartagena
C/Real 3 30201-Cartagena
FERNANDO A LÓPEZ HERNÁNDEZ
femando, lovezfcpnvct. es
Departamento de Métodos Cuantitativos e Informáticos
Universidad Politécnica de Cartagena
C/Real 3 30201-Cartagena
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
Copyright Ramón Sala Garrido 2013
Abstract
The aim of this paper is present an exploratory analysis of spatial data to describe the economic structure of the small area in Murcia Region named Campo de Cartagena. We used the ArcGIS and GeoDa software to perform this analysis using information available in the databank SABI (Analysis Systems Iberian Balance) which give the exact location of companies located in this area. In the first part of the paper a brief description of the most popular statistical spatial autocorrelation, Moran index, is showed. Moreover, we present the graphical version: the Moran scatterplot. In the second part, we apply both indicators to Business Demography to the set of data available in SABI. We conclude from this analysis that both the agricultural, industrial and construction sectors there is a strong spatial dependence structure, while the service sector, commercial or noncommercial, no spatial structure is founded. [PUBLICATION ABSTRACT]
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer