Análise estatística

Inerente aos dados GIS é a informação sobre os atributos de recursos, bem como suas localizações. Esta informação é usada para criar mapas que podem ser analisados ​​visualmente. A análise estatística ajuda a extrair informações adicionais de seus dados GIS que podem não ser óbvias, simplesmente olhando para um mapa – informações como como distribuir os valores dos atributos, se há tendências espaciais nos dados ou se os recursos formam padrões espaciais. Ao contrário das funções de consulta – como a identificação ou seleção, que fornecem informações sobre características individuais – a análise estatística revela as características de um conjunto de características como um todo.

Algumas das técnicas de análise estatística descritas neste documento são mais adequadas para aplicações interativas, como o ArcMap, que permitem selecionar e visualizar dados em um ambiente ad-hoc e fluido. Alguns dos métodos descritos aqui são encontrados nos menus e barras de ferramentas do ArcMap e não têm uma contrapartida de ferramenta de geoprocessamento. Outros métodos, como as ferramentas de estatística espacial, são implementados apenas como ferramentas de geoprocessamento.

Utilização da análise estatística

A análise estatística é freqüentemente usada para explorar seus dados – por exemplo, para examinar a distribuição de valores para um determinado atributo ou para detectar outliers (valores extremos altos ou baixos). Ter essas informações é útil ao definir classes e intervalos em um mapa, ao reclassificar dados ou ao procurar erros de dados.

No exemplo a seguir, foram calculadas estatísticas para a distribuição de idosos por setor censitário nessa região (porcentagem de pessoas com 65 anos ou mais em cada trato), incluindo a média eo desvio padrão, bem como um histograma mostrando a distribuição de Valores. A maioria dos tractos tem uma percentagem mais baixa de idosos do que a média, mas alguns tratados têm uma percentagem muito elevada.

Summary statistics and histogram complement symbology

Outro uso da análise estatística é resumir os dados. Muitas vezes, isso é feito para categorias, como calcular a área total em cada categoria de uso da terra. Você também pode criar resumos espaciais, como calcular a elevação média para cada divisão. Resumo dados é útil para obter uma melhor compreensão das condições em uma área de estudo.

No exemplo a seguir, foram calculadas estatísticas sumárias para cada classe de uso da terra indicando o número de parcelas dessa classe, o tamanho da parcela menor e maior, o tamanho médio da parcela e a área total da classe.

Parcel feature size may vary with land-use class; statistics can show the pattern.
Summary statistics can reveal patterns in data.

A análise estatística também é usada para identificar e confirmar padrões espaciais, como o centro de um grupo de características, a tendência direcional ou se os recursos formam clusters. Embora os padrões possam ser aparentes em um mapa, tentar tirar conclusões de um mapa pode ser difícil – como você classifica e simboliza os dados pode obscurecer ou enfatizar excessivamente os padrões. Funções estatísticas analisar os dados subjacentes e dar-lhe uma medida que pode ser usado para confirmar a existência ea força do padrão.

Abaixo está um exemplo de análises que mostram o centro médio de um conjunto de assaltos e a elipse de desvio padrão para um conjunto de avistamentos de alces (mostrando a tendência direcional).

Spatial statistics can show geographic patterns or trends.

Abaixo está um exemplo de uma análise que mostra clusters estatisticamente significativos de setores censitários com muitos idosos (laranja) ou poucos (azul).

Spatial statistics can show geographic patterns or trends.

Tipos de análise estatística

As funções de análise estatística no ArcGIS for Desktop são não espaciais (tabular) ou espaciais (contendo localização).

As estatísticas não-espaciais são usadas para analisar valores de atributos associados a recursos. Os valores são acessados ​​diretamente a partir da tabela de atributos de recursos de uma camada. Exemplos de estatísticas não-espaciais incluem a média eo desvio padrão.

Neste exemplo, a ferramenta Estatísticas Sumárias foi usada para calcular o número de parcelas vagas para um conjunto de setores censitários, incluindo o total, a média eo desvio padrão.

Summary statistics

Gráficos e gráficos, como um histograma ou gráficos QQ, são outra maneira de analisar dados não-espaciais. Em todos os casos, apenas os valores são analisados. As localizações dos recursos com os quais os valores estão associados – e quaisquer relações espaciais entre os recursos – não são consideradas.

Neste exemplo, o histograma mostra a distribuição de parcelas vagas (o número de parcelas vagas ao longo do eixo x eo número de traços em cada intervalo ao longo do eixo y).

Histograms show the distribution of data values.

Um gráfico QQ normal é usado para avaliar a semelhança da distribuição de um conjunto de valores com a de uma distribuição normal padrão (a curva de sino típica, quando mostrada em um histograma). A linha no gráfico Normal QQ mostra valores esperados para uma distribuição normal – quanto mais próximos os valores da linha, mais próxima a distribuição é normal. Neste exemplo, a concentração dos elementos Fósforo para um conjunto de amostras de solo está próxima da distribuição normal.

A Normal Q-Q plot compares data value distributions to a normal distribution.

A ferramenta Normal QQ Plot é uma das ferramentas de exploração de dados disponíveis com a extensão Geostatistical Analyst.

As estatísticas espaciais, por outro lado, enfocam as relações espaciais entre as características – quão compactas ou dispersas são as características, se elas estão orientadas em uma direção específica e se elas formam clusters. A relação espacial é geralmente definida como a distância (o quão distantes são as características), mas também pode ser outras formas de interação entre características.

No exemplo abaixo, a saída da ferramenta de Distância Padrão (exibida graficamente como um círculo) é calculada usando a distância de cada observação de vida selvagem a partir do centro calculado dos avistamentos.

Standard distance and mean center of a group of points

Algumas estatísticas espaciais consideram tanto as relações espaciais de recursos como os valores de um atributo associado aos recursos. Estas são conhecidas como estatísticas ponderadas – a relação espacial é influenciada pelos valores. Estatísticas espaciais ponderadas são usadas para descobrir se características que têm valores semelhantes ocorrem juntas – se, por exemplo, as escolas com pontuações de teste similarmente altas ou baixas formam clusters.

No exemplo abaixo, o centro dos parques é ponderado pelo número de visitantes em cada parque (representado pelo tamanho dos círculos verdes).

Weighted mean center of points

As funções estatísticas também podem ser classificadas por serem descritivas ou inferenciais. As estatísticas descritivas resumem algumas características dos valores ou características que você está analisando – o valor médio, a distribuição de freqüência de valores ou a tendência direcional de um grupo de características. Estatísticas descritivas são muitas vezes úteis para comparar dois conjuntos de recursos para a mesma área.

O exemplo abaixo compara a distribuição de idosos (top) com a de crianças menores de 5 anos (inferior) para o mesmo conjunto de setores censitários.

Histograms and summary statistics are a way to compare populations.

No exemplo abaixo, os círculos de distância padrão para a população americana indiana e afro-americana mostram que a distribuição da população afro-americana nesta área é muito mais compacta.

Standard distance and mean centers are a way to compare populations.

As estatísticas inferenciais usam a teoria da probabilidade para prever a ocorrência provável de valores (usando um conjunto de valores conhecidos), ou para avaliar a probabilidade de que qualquer padrão ou tendência que você vê nos dados não seja devido ao acaso. A função fornece uma medida do padrão ou relação. Em seguida, você realiza um teste estatístico sobre essa medida para determinar se é significativo em algum nível de confiança. Se a análise estatística indica que os assaltos ocorrem em clusters, então você deve executar um teste para descobrir a chance de que os clusters ocorrem por acaso. Você pode achar, por exemplo, que há uma probabilidade de 90 por cento que os clusters não ocorreu por acaso, indicando que os assaltos podem ser ligados de alguma forma. Essencialmente, para determinar a probabilidade, o teste compara a medida obtida para os recursos existentes com a medida que você esperaria obter pelo mesmo número de recursos espalhados pela mesma área, mas distribuídos aleatoriamente.

No exemplo a seguir, o mapa à esquerda mostra clusters de setores censitários com um número elevado de idosos (laranja) ou um número baixo (azul), com um nível de probabilidade de 90 por cento; O mapa direito mostra clusters em um nível de 99 por cento de probabilidade.

Compare the detected clustering at different levels of probability.

Funções de análise estatística

As funções estatísticas no ArcGIS para Desktop estão localizadas no ArcMap, ArcCatalog e geoprocessamento, bem como dentro de duas extensões: Spatial Analyst e Geostatistical Analyst .

Estatísticas da tabela

Um conjunto básico de estatísticas descritivas que resumem os valores de um único campo está disponível em vários locais no ArcGIS for Desktop : a janela de tabela no ArcMap, a guia de visualização de tabela no ArcCatalog e o conjunto de ferramentas Estatísticas (dentro da caixa de ferramentas Análise).

Função Localização Estatisticas Saída

Opção do menu Estatísticas

Janela da tabela do ArcMap ou guia de visualização da tabela ArcCatalog

Contagem, Mínimo, Máximo, Soma, Média, Desvio Padrão, Frequência histograma

Os resultados são exibidos em uma janela.

Ferramenta Estatísticas de Resumo

Caixa de Ferramentas de Análise / Conjunto de Ferramentas de Estatística

Mínimo, Máximo, Soma, Média, Desvio Padrão, Faixa, Primeiro, Último

Os resultados são escritos em uma nova tabela.

Tabela de funções de estatísticas de resumo para um único campo

Para resumir um campo por um ou mais campos (por exemplo, para contar o número de parcelas em cada classe de uso da terra, somar a área em cada classe de uso da terra ou encontrar o tamanho médio da parcela em cada classe), use a Resumir na janela da tabela do ArcMap ou na ferramenta Frequência no conjunto de ferramentas Estatísticas na caixa de ferramentas Análise.

Função Localização Estatisticas Saída

Opção de menu Resumir

Janela da tabela do ArcMap (clique com o botão direito do mouse no nome do campo)

Mínimo, Máximo, Média (média), Soma, Desvio Padrão, Variação

Os resultados são gravados em uma nova tabela.

Ferramenta de freqüência

Caixa de Ferramentas de Análise / Conjunto de Ferramentas de Estatística

Contagem, Soma

Os resultados são gravados em uma nova tabela.

Tabela de funções de estatísticas de resumo de núcleo para mais de um campo

Estatísticas Espaciais

A caixa de ferramentas Estatísticas Espaciais contém um número de rotinas estatísticas para analisar a distribuição de um conjunto de recursos, analisando padrões e identificando clusters.

área funcional Conjunto de ferramentas Ferramentas

Medidas de distribuição geográfica

Medição de distribuições geográficas

Centro Médio, Característica Central, Distância Padrão, Distribuição Direcional (Elipse Padrão Deviacional), Média Direcional Linear

Análise de padrões geográficos

Analisando padrões

Vizinhança Proxima Média, Autocorrelação Espacial (I de Moran), Clustering Alto / Baixo (Getis-Ord Geral G)

Análise de agrupamentos geográficos

Mapeamento de clusters

Cluster e Outlier Análise (Anselin Local Moran’s I), Hot Spot Análise (Getis-Ord Gi *)

Análise de regressão

Modelando relações espaciais

Quadrados Mínimos Ordinários, Regressão Exploratória, Regressão Geograficamente Ponderada

Funções e locais das ferramentas de Estatísticas Espaciais

Estatísticas raster

O Spatial Analyst inclui várias funções estatísticas que podem ser usadas para analisar rasters, principalmente para resumir valores de atributo e atribuir as estatísticas de resumo a células em uma nova camada raster. Estes estão localizados em vários conjuntos de ferramentas diferentes com a caixa de ferramentas Spatial Analyst .

Ferramenta Localização Entrada Saída O que faz

Estatísticas de células

Conjunto de ferramentas local

Múltiplos rasters

Raster

Calcula a estatística especificada para cada célula com base em várias entradas

Estatísticas Focais

Conjunto de Ferramentas de Bairro

Raster

Raster

Resume os valores de um raster dentro de uma vizinhança definida ao redor de cada célula e atribui o valor a essa célula no raster de saída

Estatísticas de pontos

Conjunto de Ferramentas de Bairro

Recursos de ponto

Raster

Resume valores para atributos de atributos de ponto dentro de um bairro definido e atribui valores a células no raster de saída

Estatísticas de Linha

Conjunto de Ferramentas de Bairro

Recursos de linha

Raster

Resume valores para atributos de recurso de linha dentro de um bairro definido e atribui valores a células no raster de saída

Estatísticas Zonais

Conjunto de ferramentas Zonal

Recursos de raster ou polígono

Tabela raster ou resumo

Resume valores de uma superfície raster por categorias ou classes (zonas) do conjunto de dados de raster ou polygon de entrada

Tabela de resumo de ferramentas de estatísticas de quadros

Ferramentas de exploração de dados

O Analista de Geoestatística – ao mesmo tempo em que se concentra na criação de superfície a partir de um conjunto de pontos de amostra – também contém um conjunto de ferramentas para a exploração visual de valores de dados usando gráficos e gráficos. Estes são frequentemente utilizados antes da criação da superfície para decidir quais os parâmetros a utilizar para um conjunto específico de dados, mas também pode ser utilizado em geral para explorar o seu conjunto de dados. As ferramentas permitem explorar a distribuição de valores, se há uma tendência direcional nos dados e se há relações entre dois atributos (por exemplo, para ver se os valores variam em conjunto ou inversamente). As ferramentas estão disponíveis na opção Explorar Dados na barra de ferramentas do Analisador Geoestatístico .

Tópicos relacionados

Revistas Eletrônicas de Arquitetura e Urbanismo

Ciência da Computação

Cartographies of Disease: Maps, Mapping, and Medicine

Cartographies of Disease: Maps, Mapping, and Medicine, new expanded edition, is a comprehensive survey of the technology of mapping and its relationship to the battle against disease. This look at medical mapping advances the argument that maps are not merely representations of spatial realities but a way of thinking about relationships between viral and bacterial communities, human hosts, and the environments in which diseases flourish. Cartographies of Disease traces the history of medical mapping from its growth in the 19th century during an era of trade and immigration to its renaissance in the 1990s during a new era of globalization. Referencing maps older than John Snow’s famous cholera maps of London in the mid-19th century, this survey pulls from the plague maps of the 1600s, while addressing current issues concerning the ability of GIS technology to track diseases worldwide. The original chapters have some minor updating, and two new chapters have been added. Chapter 13 attempts to understand how the hundreds of maps of Ebola revealed not simply disease incidence but the way in which the epidemic itself was perceived. Chapter 14 is about the spatiality of the disease and the means by which different cartographic approaches may affect how infectious outbreaks like ebola can be confronted and contained.

Cartographies of Disease: Maps, Mapping, and Medicine, new expanded edition: 9781589484672: Medicine & Health Science Books @ Amazon.com

Fonte: Cartographies of Disease: Maps, Mapping, and Medicine, new expanded edition: 9781589484672: Medicine & Health Science Books @ Amazon.com

DLR – Earth Observation Center – Global Urban Footprint

Marcas da ocupação urbana sobre a terra. Mais de metade da população mundial já vive em cidades e a tendência global de urbanização apresenta a humanidade com novos desafios. Nas áreas rurais, a expansão urbana está aumentando de forma constante. As consequências deste crescimento incluem a perda de terras agrícolas férteis e áreas naturais valiosas, bem como mudanças no microclima local ou uma deficiência negativa da biodiversidade. Ao mesmo tempo, aumenta a susceptibilidade a desastres naturais, como tempestades ou inundações. Especialmente, o enorme crescimento da população em megacidades muitas vezes leva a tensões sociais.

Fonte: DLR – Earth Observation Center – Global Urban Footprint

Mapzone | Ordnance Survey

A curiosa maneira de explicar o que é GIS (SIG) para crianças, no site inglês da empresa ordnancesurvey: Information Systems (GIS) touch many parts of our lives – often without a map in sight. It’s the invisible force that helps deliver your pizza to the right address, gives a realistic dimension to computer games and provides text directions to your local cinema.

Fonte: Mapzone | Ordnance Survey