Quick facts about the datasets:

Reference data
- Anatomic region: healthy mouse primary visual cortex (VISp)
- Protocol: single cell RNA sequencing (scRNAseq)
- Citation: Shared and distinct transcriptomic cell types across neocortical areas
Query data
- Anatomic region: healthy mouse primary visual cortex (VISp)
- Protocol: smFISH spatial transcriptomics
- Citation: SpaceTx

library(tidyverse)
library(FRmatch)
library(SingleCellExperiment)
library(viridis)

Data

Pre-clustering of spatial data

The smFISH data is pre-clustered following the SCANPY pipeline using Leiden clustering with resolution 0.8, which resulted in 16 smFISH clusters shown in a UMAP below.

smFISH clusters

Load data objects

Load pre-made data objects. See here to construct your own data object. The markers in this case will be the smFISH probe genes.

load("~/Documents/SpaceTx-2020/Data/dat-smFISH-filtered-cluster.rda")
load("~/Documents/SpaceTx-2020/Data/dat-scRNA-smFISHprobes.rda")
ls()

[1] "sce.scRNA"  "sce.smFISH"

Check the gene exprresion distribution from the two assays. The density plots showed very different data range and distributional property.

par(mfrow=c(1,2))
plot(density(assay(sce.smFISH)), main="smFISH")
plot(density(assay(sce.scRNA)), main="scRNAseq")

Normalization

Use the built-in normalization function in FR-Match to align the distributions.

sce.scRNA.norm <- normalization(sce.scRNA)
sce.smFISH.norm <- normalization(sce.smFISH, norm.by = "mean")

par(mfrow=c(1,2))
plot(density(assay(sce.smFISH.norm)), main="smFISH after normalization")
plot(density(assay(sce.scRNA.norm)), main="scRNAseq after normalization")

Note that, in our gene by gene examination, we noticed that the sensitivity of the Kcnip4 probe gene in smFISH was low (i.e. noise-like weak expression), therefore we remove this probe gene in our analysis.

par(mfrow=c(1,2))
plot(density(assay(sce.smFISH.norm)["Kcnip4",]), main="Kcnip4 | smFISH normalized")
plot(density(assay(sce.scRNA.norm)["Kcnip4",]), main="Kcnip4 | scRNAseq normalized")

rowData(sce.smFISH.norm)["Kcnip4",] <- 0
rowData(sce.scRNA.norm)["Kcnip4",] <- 0

FR-Match (cell2cluster)

myrst <- FRmatch_cell2cluster(sce.smFISH.norm, sce.scRNA.norm, 
                              filter.size=5, subsamp.size=10, subsamp.iter=1e3)

Plot the results

Preparing for spatial plot.

## spatial coordinates
coord <- read.csv("~/Documents/SpaceTx-2020/Data/smFISH_filtered/smFISH_filtered_metadata.csv") %>% 
  select(sample_name, rotated_x, rotated_y) %>% mutate(cell=as.character(sample_name), x=rotated_x, y=rotated_y) %>% 
  select(cell, x, y)
## order query (smFISH) clusters based on SCANPY dendrogram
query.cluster.levels <- paste0("query.",c("15","11","7","10","0","12","9","14",
                                          "2","3","6","1","5","4","8","13"))
## scRNA cluster map between consensus clusters and subclasses
sumtab.clusters <- data.table::fread("~/Documents/SpaceTx-2020/Data/snRNAseq/mouseVISp_cluster_summary.csv")
scRNA.cluster.map <- sumtab.clusters %>% select(consensus_cluster, subclass, broad_class) %>% distinct() %>% 
  filter(!(consensus_cluster=="cl12_i155_Crabp1_Sncg"&subclass=="Lamp5"))

Here, we used a bottom-up strategy to summarize the cell type calling at the subclass level. The granularity of the scRNAseq data is high, which resulted in 191 consensus cell types corresponding to 22 cell subclasses.

df.myrst <- myrst$cell2cluster %>% mutate(match=gsub("ref.","",match))
df <- inner_join(coord, df.myrst, by=c("cell"="query.cell")) %>% 
  mutate(query.cluster = factor(query.cluster, levels = query.cluster.levels)) %>%
  left_join(scRNA.cluster.map, by=c("match"="consensus_cluster")) #bottom-up cluster map

## plot subclass
g <- ggplot(df, aes(x=x, y=y, col=query.cluster, label=gsub("query.","",query.cluster))) + 
  geom_point(aes(alpha=score)) + geom_text(size=2) +
  xlim(min(df$x)-1, max(df$x)+1) + ylim(min(df$y)-1, max(df$y)+1) + 
  theme_bw() +
  facet_wrap(~ subclass, ncol=4)
g

Conclusion:

Major glutamatergic subclasses are in the expected layers; major GABAergic subclasses also reflect the expected laminar pattern.
FR-Match is able to merge the over-partitioned query clusters, e.g. L4 plot, to the same reference cluster.
Matched cells to the glial types (Oligo, VLMC) are questionable. It seems that the glial types attracts all weak cells probably due to the gene panel design. More investigations needed.

LS0tCnRpdGxlOiAiQ2VsbCB0eXBlIGNhbGxpbmcgZm9yIHNwYXRpYWwgdHJhbnNjcmlwdG9taWNzIChzcGFjZVR4KSBkYXRhIC0gc21GSVNIIGFuZCBzY1JOQXNlcSIKb3V0cHV0OiBodG1sX25vdGVib29rCmF1dGhvcjogIll1biAoUmVuZWUpIFpoYW5nLCB6aGFuZ3lAamN2aS5vcmciCmRhdGU6ICJgciBmb3JtYXQoU3lzLnRpbWUoKSwgJyVCICVkLCAlWScpYCIKLS0tCgpgYGB7ciwgaW5jbHVkZT1GQUxTRX0Kcm0obGlzdD1scygpKQpzZXR3ZCgifi9Eb2N1bWVudHMvU3BhY2VUeC0yMDIwL1JlYWxfZGF0YV9hbmFseXNlcy9GUm1hdGNoX21hcHBpbmcvc21GSVNIX2ZpbHRlcmVkLyIpCmBgYAoKUXVpY2sgZmFjdHMgYWJvdXQgdGhlIGRhdGFzZXRzOgoKKyBSZWZlcmVuY2UgZGF0YQogICsgQW5hdG9taWMgcmVnaW9uOiBoZWFsdGh5IG1vdXNlIHByaW1hcnkgdmlzdWFsIGNvcnRleCAoVklTcCkKICArIFByb3RvY29sOiBzaW5nbGUgY2VsbCBSTkEgc2VxdWVuY2luZyAoc2NSTkFzZXEpCiAgKyBDaXRhdGlvbjogW1NoYXJlZCBhbmQgZGlzdGluY3QgdHJhbnNjcmlwdG9taWMgY2VsbCB0eXBlcyBhY3Jvc3MgbmVvY29ydGljYWwgYXJlYXNdKGh0dHBzOi8vd3d3Lm5hdHVyZS5jb20vYXJ0aWNsZXMvczQxNTg2LTAxOC0wNjU0LTUpCisgUXVlcnkgZGF0YQogICsgQW5hdG9taWMgcmVnaW9uOiBoZWFsdGh5IG1vdXNlIHByaW1hcnkgdmlzdWFsIGNvcnRleCAoVklTcCkKICArIFByb3RvY29sOiBzbUZJU0ggc3BhdGlhbCB0cmFuc2NyaXB0b21pY3MKICArIENpdGF0aW9uOiBbU3BhY2VUeF0oaHR0cHM6Ly9zcGFjZXR4LXdlYnNpdGUuZ2l0aHViLmlvLykKCmBgYHtyLCBtZXNzYWdlPUZBTFNFfQpsaWJyYXJ5KHRpZHl2ZXJzZSkKbGlicmFyeShGUm1hdGNoKQpsaWJyYXJ5KFNpbmdsZUNlbGxFeHBlcmltZW50KQpsaWJyYXJ5KHZpcmlkaXMpCmBgYAoKIyBEYXRhCgojIyBQcmUtY2x1c3RlcmluZyBvZiBzcGF0aWFsIGRhdGEKClRoZSBzbUZJU0ggZGF0YSBpcyBwcmUtY2x1c3RlcmVkIGZvbGxvd2luZyB0aGUgU0NBTlBZIHBpcGVsaW5lIHVzaW5nIExlaWRlbiBjbHVzdGVyaW5nIHdpdGggcmVzb2x1dGlvbiAwLjgsIHdoaWNoIHJlc3VsdGVkIGluIDE2IHNtRklTSCBjbHVzdGVycyBzaG93biBpbiBhIFVNQVAgYmVsb3cuCgohW3NtRklTSCBjbHVzdGVyc10oU0NBTlBZX2NsdXN0ZXJpbmcucG5nKXt3aWR0aD0zNTBweH0KCiMjIExvYWQgZGF0YSBvYmplY3RzCgpMb2FkIHByZS1tYWRlIGRhdGEgb2JqZWN0cy4gU2VlIFtoZXJlXShodHRwczovL2pjdmVudGVyaW5zdGl0dXRlLmdpdGh1Yi5pby9jZWxsaWdyYXRlL0ZSbWF0Y2gtdmlnbmV0dGUuaHRtbCkgdG8gY29uc3RydWN0IHlvdXIgb3duIGRhdGEgb2JqZWN0LiBUaGUgbWFya2VycyBpbiB0aGlzIGNhc2Ugd2lsbCBiZSB0aGUgc21GSVNIIHByb2JlIGdlbmVzLgpgYGB7cn0KbG9hZCgifi9Eb2N1bWVudHMvU3BhY2VUeC0yMDIwL0RhdGEvZGF0LXNtRklTSC1maWx0ZXJlZC1jbHVzdGVyLnJkYSIpCmxvYWQoIn4vRG9jdW1lbnRzL1NwYWNlVHgtMjAyMC9EYXRhL2RhdC1zY1JOQS1zbUZJU0hwcm9iZXMucmRhIikKbHMoKQpgYGAKCkNoZWNrIHRoZSBnZW5lIGV4cHJyZXNpb24gZGlzdHJpYnV0aW9uIGZyb20gdGhlIHR3byBhc3NheXMuIFRoZSBkZW5zaXR5IHBsb3RzIHNob3dlZCB2ZXJ5IGRpZmZlcmVudCBkYXRhIHJhbmdlIGFuZCBkaXN0cmlidXRpb25hbCBwcm9wZXJ0eS4KYGBge3IsIGZpZy53aWR0aD05LCBmaWcuaGVpZ2h0PTQuNX0KcGFyKG1mcm93PWMoMSwyKSkKcGxvdChkZW5zaXR5KGFzc2F5KHNjZS5zbUZJU0gpKSwgbWFpbj0ic21GSVNIIikKcGxvdChkZW5zaXR5KGFzc2F5KHNjZS5zY1JOQSkpLCBtYWluPSJzY1JOQXNlcSIpCmBgYAoKIyMgTm9ybWFsaXphdGlvbgoKVXNlIHRoZSBidWlsdC1pbiBub3JtYWxpemF0aW9uIGZ1bmN0aW9uIGluIEZSLU1hdGNoIHRvIGFsaWduIHRoZSBkaXN0cmlidXRpb25zLgpgYGB7cn0Kc2NlLnNjUk5BLm5vcm0gPC0gbm9ybWFsaXphdGlvbihzY2Uuc2NSTkEpCnNjZS5zbUZJU0gubm9ybSA8LSBub3JtYWxpemF0aW9uKHNjZS5zbUZJU0gsIG5vcm0uYnkgPSAibWVhbiIpCmBgYAoKYGBge3IsIGZpZy53aWR0aD05LCBmaWcuaGVpZ2h0PTQuNX0KcGFyKG1mcm93PWMoMSwyKSkKcGxvdChkZW5zaXR5KGFzc2F5KHNjZS5zbUZJU0gubm9ybSkpLCBtYWluPSJzbUZJU0ggYWZ0ZXIgbm9ybWFsaXphdGlvbiIpCnBsb3QoZGVuc2l0eShhc3NheShzY2Uuc2NSTkEubm9ybSkpLCBtYWluPSJzY1JOQXNlcSBhZnRlciBub3JtYWxpemF0aW9uIikKYGBgCgpOb3RlIHRoYXQsIGluIG91ciBnZW5lIGJ5IGdlbmUgZXhhbWluYXRpb24sIHdlIG5vdGljZWQgdGhhdCB0aGUgc2Vuc2l0aXZpdHkgb2YgdGhlIEtjbmlwNCBwcm9iZSBnZW5lIGluIHNtRklTSCB3YXMgbG93IChpLmUuIG5vaXNlLWxpa2Ugd2VhayBleHByZXNzaW9uKSwgdGhlcmVmb3JlIHdlIHJlbW92ZSB0aGlzIHByb2JlIGdlbmUgaW4gb3VyIGFuYWx5c2lzLgpgYGB7ciwgZmlnLndpZHRoPTksIGZpZy5oZWlnaHQ9NC41fQpwYXIobWZyb3c9YygxLDIpKQpwbG90KGRlbnNpdHkoYXNzYXkoc2NlLnNtRklTSC5ub3JtKVsiS2NuaXA0IixdKSwgbWFpbj0iS2NuaXA0IHwgc21GSVNIIG5vcm1hbGl6ZWQiKQpwbG90KGRlbnNpdHkoYXNzYXkoc2NlLnNjUk5BLm5vcm0pWyJLY25pcDQiLF0pLCBtYWluPSJLY25pcDQgfCBzY1JOQXNlcSBub3JtYWxpemVkIikKYGBgCgpgYGB7cn0Kcm93RGF0YShzY2Uuc21GSVNILm5vcm0pWyJLY25pcDQiLF0gPC0gMApyb3dEYXRhKHNjZS5zY1JOQS5ub3JtKVsiS2NuaXA0IixdIDwtIDAKYGBgCgojIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIwoKIyBGUi1NYXRjaCAoY2VsbDJjbHVzdGVyKQoKYGBge3J9Cm15cnN0IDwtIEZSbWF0Y2hfY2VsbDJjbHVzdGVyKHNjZS5zbUZJU0gubm9ybSwgc2NlLnNjUk5BLm5vcm0sIAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICBmaWx0ZXIuc2l6ZT01LCBzdWJzYW1wLnNpemU9MTAsIHN1YnNhbXAuaXRlcj0xZTMpCmBgYAoKIyMgUGxvdCB0aGUgcmVzdWx0cwoKUHJlcGFyaW5nIGZvciBzcGF0aWFsIHBsb3QuCmBgYHtyfQojIyBzcGF0aWFsIGNvb3JkaW5hdGVzCmNvb3JkIDwtIHJlYWQuY3N2KCJ+L0RvY3VtZW50cy9TcGFjZVR4LTIwMjAvRGF0YS9zbUZJU0hfZmlsdGVyZWQvc21GSVNIX2ZpbHRlcmVkX21ldGFkYXRhLmNzdiIpICU+JSAKICBzZWxlY3Qoc2FtcGxlX25hbWUsIHJvdGF0ZWRfeCwgcm90YXRlZF95KSAlPiUgCiAgbXV0YXRlKGNlbGw9YXMuY2hhcmFjdGVyKHNhbXBsZV9uYW1lKSwgeD1yb3RhdGVkX3gsIHk9cm90YXRlZF95KSAlPiUgCiAgc2VsZWN0KGNlbGwsIHgsIHkpCiMjIG9yZGVyIHF1ZXJ5IChzbUZJU0gpIGNsdXN0ZXJzIGJhc2VkIG9uIFNDQU5QWSBkZW5kcm9ncmFtCnF1ZXJ5LmNsdXN0ZXIubGV2ZWxzIDwtIHBhc3RlMCgicXVlcnkuIixjKCIxNSIsIjExIiwiNyIsIjEwIiwiMCIsIjEyIiwiOSIsIjE0IiwKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIjIiLCIzIiwiNiIsIjEiLCI1IiwiNCIsIjgiLCIxMyIpKQojIyBzY1JOQSBjbHVzdGVyIG1hcCBiZXR3ZWVuIGNvbnNlbnN1cyBjbHVzdGVycyBhbmQgc3ViY2xhc3NlcwpzdW10YWIuY2x1c3RlcnMgPC0gZGF0YS50YWJsZTo6ZnJlYWQoIn4vRG9jdW1lbnRzL1NwYWNlVHgtMjAyMC9EYXRhL3NuUk5Bc2VxL21vdXNlVklTcF9jbHVzdGVyX3N1bW1hcnkuY3N2IikKc2NSTkEuY2x1c3Rlci5tYXAgPC0gc3VtdGFiLmNsdXN0ZXJzICU+JSBzZWxlY3QoY29uc2Vuc3VzX2NsdXN0ZXIsIHN1YmNsYXNzLCBicm9hZF9jbGFzcykgJT4lIGRpc3RpbmN0KCkgJT4lIAogIGZpbHRlcighKGNvbnNlbnN1c19jbHVzdGVyPT0iY2wxMl9pMTU1X0NyYWJwMV9TbmNnIiZzdWJjbGFzcz09IkxhbXA1IikpCmBgYAoKSGVyZSwgd2UgdXNlZCBhIF9fYm90dG9tLXVwX18gc3RyYXRlZ3kgdG8gc3VtbWFyaXplIHRoZSBjZWxsIHR5cGUgY2FsbGluZyBhdCB0aGUgc3ViY2xhc3MgbGV2ZWwuIFRoZSBncmFudWxhcml0eSBvZiB0aGUgc2NSTkFzZXEgZGF0YSBpcyBoaWdoLCB3aGljaCByZXN1bHRlZCBpbiAxOTEgY29uc2Vuc3VzIGNlbGwgdHlwZXMgY29ycmVzcG9uZGluZyB0byAyMiBjZWxsIHN1YmNsYXNzZXMuCmBgYHtyfQpkZi5teXJzdCA8LSBteXJzdCRjZWxsMmNsdXN0ZXIgJT4lIG11dGF0ZShtYXRjaD1nc3ViKCJyZWYuIiwiIixtYXRjaCkpCmRmIDwtIGlubmVyX2pvaW4oY29vcmQsIGRmLm15cnN0LCBieT1jKCJjZWxsIj0icXVlcnkuY2VsbCIpKSAlPiUgCiAgbXV0YXRlKHF1ZXJ5LmNsdXN0ZXIgPSBmYWN0b3IocXVlcnkuY2x1c3RlciwgbGV2ZWxzID0gcXVlcnkuY2x1c3Rlci5sZXZlbHMpKSAlPiUKICBsZWZ0X2pvaW4oc2NSTkEuY2x1c3Rlci5tYXAsIGJ5PWMoIm1hdGNoIj0iY29uc2Vuc3VzX2NsdXN0ZXIiKSkgI2JvdHRvbS11cCBjbHVzdGVyIG1hcApgYGAKCmBgYHtyLCBmaWcuaGVpZ2h0PTcsIGZpZy53aWR0aD05fQojIyBwbG90IHN1YmNsYXNzCmcgPC0gZ2dwbG90KGRmLCBhZXMoeD14LCB5PXksIGNvbD1xdWVyeS5jbHVzdGVyLCBsYWJlbD1nc3ViKCJxdWVyeS4iLCIiLHF1ZXJ5LmNsdXN0ZXIpKSkgKyAKICBnZW9tX3BvaW50KGFlcyhhbHBoYT1zY29yZSkpICsgZ2VvbV90ZXh0KHNpemU9MikgKwogIHhsaW0obWluKGRmJHgpLTEsIG1heChkZiR4KSsxKSArIHlsaW0obWluKGRmJHkpLTEsIG1heChkZiR5KSsxKSArIAogIHRoZW1lX2J3KCkgKwogIGZhY2V0X3dyYXAofiBzdWJjbGFzcywgbmNvbD00KQpnCmBgYAoKX19Db25jbHVzaW9uOl9fCgorIE1ham9yIGdsdXRhbWF0ZXJnaWMgc3ViY2xhc3NlcyBhcmUgaW4gdGhlIGV4cGVjdGVkIGxheWVyczsgbWFqb3IgR0FCQWVyZ2ljIHN1YmNsYXNzZXMgYWxzbyByZWZsZWN0IHRoZSBleHBlY3RlZCBsYW1pbmFyIHBhdHRlcm4uCisgRlItTWF0Y2ggaXMgYWJsZSB0byBtZXJnZSB0aGUgb3Zlci1wYXJ0aXRpb25lZCBxdWVyeSBjbHVzdGVycywgZS5nLiBMNCBwbG90LCB0byB0aGUgc2FtZSByZWZlcmVuY2UgY2x1c3Rlci4KKyBNYXRjaGVkIGNlbGxzIHRvIHRoZSBnbGlhbCB0eXBlcyAoT2xpZ28sIFZMTUMpIGFyZSBxdWVzdGlvbmFibGUuIEl0IHNlZW1zIHRoYXQgdGhlIGdsaWFsIHR5cGVzIGF0dHJhY3RzIGFsbCB3ZWFrIGNlbGxzIHByb2JhYmx5IGR1ZSB0byB0aGUgZ2VuZSBwYW5lbCBkZXNpZ24uIE1vcmUgaW52ZXN0aWdhdGlvbnMgbmVlZGVkLg==

Cell type calling for spatial transcriptomics (spaceTx) data - smFISH and scRNAseq

Yun (Renee) Zhang, zhangy@jcvi.org

December 02, 2021